ELab-Zero 종합 분석: 로컬 배포 가능한 모바일 GUI 에이전트 스택
1. 요약 GELab-Zero는 StepFun의 오픈소스 GUI 에이전트 솔루션으로, 주로 안드로이드 모바일 애플리케이션의 자동화 및 지능형 상호작용을 위한 완전한 "model + engineering infrastructure" 스택을 제공합니다. 이 프로젝트에는 로...
1. 요약 GELab-Zero는 StepFun의 오픈소스 GUI 에이전트 솔루션으로, 주로 안드로이드 모바일 애플리케이션의 자동화 및 지능형 상호작용을 위한 완전한 "model + engineering infrastructure" 스택을 제공합니다. 이 프로젝트에는 로...
1. 추상 화 훈위안 3D 엔진 글로벌은 텐센트의 훈위안 팀이 전 세계를 위해 출시한 AI 3D 생성 엔진으로, 자체 개발한 훈위안3D 대형 모델 계열과 클라우드 API 서비스를 기반으로 합니다. 이 플랫폼은 텍스트, 이미지, 스케치에서 고품질 3D 모델을 직접 생성하...
1. 요약 FLUX.2는 Black Forest Labs에서 출시한 차세대 시각 생성 및 편집 모델로, 단순히 장면을 시연하는 것이 아니라 실제 제작 수준의 창작 워크플로우를 목표로 합니다. 최대 약 4MP 해상도, 다중 참조 이미지 입력, 미세 타이포그래피 텍스트 및...
1. 요약 HunyuanOCR은 텐센트의 Hunyuan 팀이 오픈소스로 만든 종단 간 OCR 전문가 모델로, Hunyuan의 자체 멀티모달 아키텍처와 교육 전략을 기반으로 하며, 약 10억 개의 매개변수만으로도 OCRBench(<3B 스케일)와 OmniDocBench에...
1. 추상 HunyuanVideo 1.5는 텐센트 Hunyuan 팀이 개발한 오픈 소스 텍스트/이미지 생성 비디오 모델로, DiT 아키텍처를 기반으로 약 8.3B의 파라미터를 가지고 있습니다. 주요 특징은 메모리 친화적이며, 약 14GB 비디오 메모리를 갖춘 소비자용 ...
1. Abstract AMO-Bench는 메이투안의 LongCat 팀이 시작한 고급 수학적 추론 벤치마크로, 국제 수학 올림피아드(IMO) 수준과 더 높은 난이도 대회 문제에 중점을 둡니다. 벤치마크는 50개의 새로운 인간 전문가 설계 문제로 구성되어 있으며, 시스템은...