OpenAI Codex는 $.skill 이름 호출과 자동 선택을 지원하는 에이전트 스킬즈를 출시했습니다
OpenAI 개발자 문서에 따르면 Codex는 이제 "에이전트 스킬"을 지원하며, 이는 작업별 지침, 자원, 선택적 스크립트를 재사용 가능한 기능으로 포장하여 Codex CLI 및 IDE 확장에서 사용할 수 있습니다. 사용자는 $.skill-name 를 통해 명시적으로...
OpenAI 개발자 문서에 따르면 Codex는 이제 "에이전트 스킬"을 지원하며, 이는 작업별 지침, 자원, 선택적 스크립트를 재사용 가능한 기능으로 포장하여 Codex CLI 및 IDE 확장에서 사용할 수 있습니다. 사용자는 $.skill-name 를 통해 명시적으로...
최근 음성과 동영상 인공지능 분야는 여러 가지 기술 발표를 맞이했고, 다중모드 생성 모델 Wan2.6 및 음성 모델 Fun-ASR, Fun-CosyVoice 3가 잇달아 발표되어 창작자와 개발자의 관심을 끌었다.관련 모델은 캐릭터의 외관, 소리와 서사 스타일의 일치성 ...
Gemini 3 Flash는 구글 검색의 'AI 모드' 기본 모델로 전 세계적으로 출시됩니다. 공식적으로 새 모델은 검색 속도를 유지하면서 추론 및 이해 능력을 향상시키고, 더 복잡한 다조건부 질문, 비교 및 계획 요구에 대해 더 구조적이고 읽기 쉬운 답변을 출력할 수...
1. 오픈 소스 및 액세스 MiMo는 가중치와 지원 데이터를 공개했습니다. Hugging Face의 XiaomiMiMo 조직 페이지에서 모델(MiMo-V2-Flash/Base 등 포함)을 우선적으로 확보하며, 기술 보고서와 일부 코드는 GitHub에서 확인할 수 있습니...
OpenAI는 GPT-5 시리즈의 코드 모델 버전인 GPT-5.2 Codex를 공식적으로 공개했으며, 이 버전은 프로그래밍 및 소프트웨어 엔지니어링 시나리오에 중점을 두고 있습니다. 공식 소개에 따르면, 이 모델은 이전 버전에 비해 코드 생성, 이해, 디버깅, 리팩토링...
메타의 자회사인 메타의 AI는 오픈소스 퍼셉션 인코더 오디오비주얼(PE-AV)을 발표하며, 이를 SAM 오디오가 최첨단 오디오 분리 효과를 구현하는 핵심 기술 엔진으로 자리매김했습니다. 이전의 Perception Encoder 시스템을 기반으로 하며, PE-AV는 오디...