돌아가기 AI는 오픈 소스입니다.
Zhipu AI 오픈 소스 Open-AutoGLM 및 AutoGLM-Phone-9B: 모바일 폰 에이전트의 새로운 출발점

Zhipu AI 오픈 소스 Open-AutoGLM 및 AutoGLM-Phone-9B: 모바일 폰 에이전트의 새로운 출발점

AI는 오픈 소스입니다. Admin 462 회 조회

1. 추상

Open-AutoGLM은 Zhipu AI용 오픈소스 모바일 폰 에이전트 프레임워크이며, 핵심 모델은 AutoGLM-Phone-9B입니다. 휴대폰 화면의 내용을 이해하고 실제 사용자 조작을 시뮬레이션하여 "인터페이스 이해, 지시사항 이해, 휴대폰 클릭"을 달성합니다. 이 프레임워크는 주로 안드로이드 시나리오용이며, 모바일 어시스턴트, 자동화 운영, 테스트 등 다양한 애플리케이션 구축에 적합합니다.

2. 핵심 기능

  1. 자연어 구동: 중국어 자연어로 작업을 설명하고 다단계 작전 계획을 자동으로 생성합니다.
  2. 화면에 대한 다중 모달 이해: 비전과 텍스트를 결합하여 버튼, 아이콘, 카피라이팅, 레이아웃을 인식할 수 있도록 순수 좌표 스크립트가 아닙니다.
  3. ADB 제어 실행: 클릭, 스와이프, 입력 및 기타 동작은 ADB를 통해 완료할 수 있으며, 실제 기기나 클라우드 폰에 연결할 수 있습니다.
  4. 멀티앱 시나리오: 위챗, 타오바오, 두인, 메이투안과 같은 고빈도 애플리케이션을 위해 설계되었으며, 크로스 앱 작업 체인을 지원합니다.
  5. 오픈 소스 모델: AutoGLM-Phone-9B는 일반 휴대전화 에이전트 모델로서 2차 학습과 적응에 편리합니다.

3. 설치

  1. 환경 준비: 파이썬과 필요한 의존성 라이브러리를 설치하며, 가상 환경을 사용하는 것이 권장됩니다.
  2. 저장소 복제: git을 Open-AutoGLM으로 복제하고 README에 따라 프로젝트를 구성합니다.
  3. 모델 다운로드: 공식 ModelScope 또는 HuggingFace 주소에서 AutoGLM-Phone-9B 무게를 받아보세요.
  4. 기기 연결: 안드로이드 개발자 모드와 USB 디버깅을 켜고, ADB로 기기 연결이 완료되었는지 확인하세요.
  5. 예제 실행: 샘플 스크립트를 실행하고 간단한 명령어를 테스트하여 링크를 검증합니다.

4. 일반적인 사용 사례

  1. 스마트폰 어시스턴트: 자동 앱 열기, 콘텐츠 검색, 메시지 전송, 링크 공유 기능.
  2. 전자상거래 및 지역 생활 자동화: 상품 검색, 가격 비교, 주문 진행 상황 확인.
  3. 운영 및 고객 서비스 도구: 일괄 답변 또는 소셜 /IM 앱에서의 프로세스 안내.
  4. 자동화 테스트: 다중 모델 및 다중 버전 앱에 대한 UI 회귀 테스트 및 장면 재생을 수행합니다.

5. 생태학과 경쟁 제품

  1. GLM 시리즈와의 시너지: Zhipu가 자체 개발한 다중 모달 대형 모델 시스템에 의존하여 기지부터 에이전트까지 통합된 솔루션을 제공합니다.
  2. 전통적인 스크립팅 도구와 비교할 때: Open-AutoGLM은 '인터페이스를 이해하는 에이전트'에 가깝며, 스크립트 유지 비용이 더 적고 일반화가 더 강합니다.
  3. 기타 이동통신 에이전트 솔루션: 오픈 소스 + 민영화된 배포 특성은 제조업체와 기업의 자체 구축 능력에 더 적합합니다.

6. 제한 및 주의사항

  1. 컴퓨팅 파워 비용: 9B 규모 모델은 여전히 로컬 추론을 위해 강력한 컴퓨팅 파워를 필요로 하며, GPU나 클라우드 환경에 의존할 수 있습니다.
  2. 호환성 및 유지보수: 모델, 시스템 버전, 앱 업데이트에 따라 인식 효과가 영향을 받으며 지속적인 조정이 필요합니다.
  3. 보안 및 준수: 계정, 결제, 개인 데이터에 관해서는 권한을 엄격히 통제해야 하며, 각 앱의 법률과 이용 약관을 준수해야 합니다.
  4. 악용 방지 위험: 브러시 용량이나 악성 크롤링 같은 상황에는 적합하지 않으며, 조직 내에서 명확한 사용 경계를 설정하는 것이 필요합니다.

7. 프로젝트 주소

 https://github.com/zai-org/Open-AutoGLM

8. FAQ

: Open-AutoGLM 오픈 소스 라이선스란 무엇인가요? 상업용 시나리오에서 사용할 수 있나요?

답변: 이 프로젝트는 Apache-2.0과 같은 느슨한 오픈 소스 프로토콜을 채택하며, 계약, 관련 법률, 플랫폼 조건을 준수한다는 전제 하에 상업적 개발 및 배포에 사용할 수 있습니다.

질문: AutoGLM-Phone-9B 모델을 Open-AutoGLM과 함께 사용해야 하나요?

답변: 아니요, 그럴 필요는 없습니다. AutoGLM-Phone-9B는 다른 에이전트 프레임워크에서 멀티모달 모델로도 사용할 수 있지만, 보다 완전한 전화 자동화 기능을 위해 Open-AutoGLM과 함께 사용할 수도 있습니다.

질문: 현재 Open-AutoGLM이 주로 지원하는 플랫폼은 무엇인가요?

답변: 현재는 안드로이드 기기 지원에 중점을 두고 있으며, 통제는 ADB 채널에 의존하고 있습니다. iOS 쪽은 추가 기능이나 해결책이 필요합니다.

Q: 모바일 에이전트를 프로덕션에서 배포할 때 어떤 모범 사례가 있나요?

답변: 특수 기기나 클라우드 폰 사용, 권한을 최소화, 테스트 계정과 공식 계정 분리, 주요 운영에 대한 수동 확인 또는 위험 관리 정책을 추가하는 것이 권장됩니다.

Open-AutoGLM 모바일 에이전트 프레임워크 소개 AutoGLM-Phone-9B 모바일 에이전트 기능 분석 Open-AutoGLM은 휴대폰 화면의 멀티모달 기능을 이해하고 있습니다 Open-AutoGLM, 중국어 자연어가 휴대전화 운영을 담당합니다 Open-AutoGLM 기반의 안드로이드 폰 어시스턴트 빌드 Open-AutoGLM은 WeChat, Taobao, Douyin, Meituan 애플리케이션을 지원합니다 Open-AutoGLM을 사용해 앱 간 작업 체인을 자동화하세요 Open-AutoGLM 시각 텍스트와 인식 버튼 아이콘이 결합된 기능 Open-AutoGLM은 ADB를 통해 실제 기계와 클라우드 전화기를 제어합니다 Open-AutoGLM은 클릭 투 스와이프 입력 및 기타 작업 명령을 지원합니다 AutoGLM-Phone-9B 모델 오픈 소스 다운로드 및 배포 가이드 Open-AutoGLM 환경 준비 및 설치 구성 단계 Open-AutoGLM 모델은 ModelScope 또는 HF에서 메서드를 사용합니다 ADB를 사용해 안드로이드 기기를 연결해 Open-AutoGLM을 실행하게 합니다 샘플 스크립트와 함께 Open-AutoGLM 명령 링크를 빠르게 경험해 보세요 전자상거래 및 지역 생활 자동화 시나리오에서의 Open-AutoGLM 소셜 IM 배치 응답 작업에서의 Open-AutoGLM 적용 AppUI 자동 테스트 회귀를 위해 Open-AutoGLM 사용하세요 Open-AutoGLM 다중 모델 및 다중 버전 UI 재생 및 호환성 체계 Open-AutoGLM vs. 전통적인 좌표 스크립팅 자동화 도구 Open-AutoGLM은 스크립트 유지 비용을 줄이고 일반화 기능을 향상시킵니다 Open-AutoGLM과 Zhipu GLM 멀티모달 모델 시스템은 시너지 효과를 낸다 오픈 오토GLM 모바일 에이전트 관행의 민영화 AutoGLM-Phone-9B는 범용 멀티모달 모델로 사용됩니다 AutoGLM-Phone-9B는 다른 에이전트 프레임워크와 연결하는 데 있어 모범 사례입니다 Open-AutoGLM 로컬 추론 컴퓨팅 파워 및 GPU 자원 평가 클라우드에서 AutoGLM-Phone-9B 추론을 배포하기 위한 권고사항 Open-AutoGLM은 다양한 모델과 안드로이드 버전과 호환됩니다 Open-AutoGLM은 자주 앱을 업데이트하기 위한 튜닝 전략입니다 모바일 에이전트는 계정 결제 데이터의 보안 및 준수 지점을 포함합니다 Open-AutoGLM의 사용은 플랫폼 이용 약관과 적용 법률의 적용을 받습니다 Open-AutoGLM이 브러시의 악의적인 크롤링과 같은 남용에 사용되는 것을 방지하세요 조직 내 Open-AutoGLM 사용에 대한 경계와 명세를 설정하세요 Open-AutoGLM 오픈 소스 프로토콜 Apache 2 포인트 0 상업용 설명 상업용 시나리오에서 Open-AutoGLM 구현을 위한 주의사항 AutoGLM-Phone-9B를 Open-AutoGLM과 함께 사용해야 하나요? Open-AutoGLM은 현재 안드로이드 플랫폼을 지원합니다 클라우드 전화 클러스터를 이용한 Open-AutoGLM 배포의 모범 사례 운영 환경에서 Open-AutoGLM 모바일 에이전트를 배포하는 운영 가이드 Open-AutoGLM 테스트 계정 공식 계정과의 격리 정책 Open-AutoGLM은 주요 고위험 운영에 대해 수동 확인 기능을 추가합니다 Open-AutoGLM을 기반으로 한 엔터프라이즈급 스마트폰 어시스턴트를 구축하세요 Open-AutoGLM 일반적인 자동화 작업 및 응용 시나리오 목록 Open-AutoGLMGitHub 프로젝트 주소 및 핵심 디렉터리 설명 Open-AutoGLM과 다른 모바일 에이전트 솔루션의 비교 운영 고객 서비스 프로세스의 효율성을 향상시키는 데 있어 Open-AutoGLM의 가치 전자상거래 검색 가격 비교 사례에서의 Open-AutoGLM Open-AutoGLM은 콘텐츠 검색 및 링크 공유의 실용적인 적용 사례입니다 크로스 앱 작업 링크를 위한 Open-AutoGLM 설계 구현 아이디어 Open-AutoGLM 미래 기능 확장 방향과 커뮤니티 생태

추천 도구

더보기