Z.ai GLM-OCR 온라인 경험을 시작: PDF 및 이미지 레이아웃 분석 지원
Z.ai Hugging Face에 가중치를 열고, 온라인 경험과 API 호출 방식을 제공하는 다중 모달 OCR 모델 GLM-OCR을 출시했습니다. 공식적으로 모델은 약 9억 개의 매개변수만 가지고 있지만, 공식 인식, 표 인식, 키 정보 추출 등 복잡한 문서 이해 작업...
Z.ai Hugging Face에 가중치를 열고, 온라인 경험과 API 호출 방식을 제공하는 다중 모달 OCR 모델 GLM-OCR을 출시했습니다. 공식적으로 모델은 약 9억 개의 매개변수만 가지고 있지만, 공식 인식, 표 인식, 키 정보 추출 등 복잡한 문서 이해 작업...
OpenAI는 Codex 애플리케이션을 출시하고 macOS에서 다운로드할 수 있게 하여 '에이전트 구축 명령 센터'로 자리매김하며, 여러 에이전트를 동시에 관리하여 장기 작업을 병렬로 수행할 수 있도록 지원했습니다. 여기에는 기능 개발, 리팩토링, 마이그레이션, 코드 ...
구글 딥마인드와 구글 랩스는 텍스트와 이미지 프롬프트를 통해 가상 세계를 창조, 편집, 탐험하는 데 중점을 둔 실험적 프로토타입 "프로젝트 지니"를 출시했습니다. 이 과정은 사용자가 세계와 캐릭터를 디자인하는 과정을 포함하며, 먼저 Nano Banana Pro로 조절 ...
OpenAI는 미국에서 로그인한 성인을 위한 ChatGPT 광고 테스트를 "앞으로 몇 주 내" 출시할 예정이며, 웹 및 모바일 애플리케이션으로 광고 노출을 확대할 계획이라고 밝혔습니다. 광고는 답변과 별도로 "스폰서십" 형태로 표시되며, 보통 답변 하단에 표시되며, 담...
Anthropic은 "AI 지원이 코딩 기술 형성에 미치는 영향" 연구를 발표했으며, 이는 "AI 보조 프로그래밍"과 "손으로 작성된 코드" 조건 하에서 유사한 작업을 완료한 개발자들의 기술 숙달도를 비교한 것입니다. 연구는 AI 보조 사용이 통계적으로 유의미한 "숙달...
커서 팀은 agent-trace.dev 년에 "에이전트 트레이스" 명세(버전 0.1.0, RFC 상태)를 공개하여, "어떤 변경이 AI에서 왔고 어떤 것이 인간에서 왔는지"를 버전 관리 코드베이스에서 문서화하고, 모델 정보와 관련 대화를 특정 코드 기여와 연관시키는 개...