OpenAI는 '고백' 메커니즘을 출시했으며, 연구에 따르면 고백을 통해 GPT-5 모델을 훈련시키면 '자기보고' 비율이 크게 증가할 수 있습니다
OpenAI는 "고백을 통해 언어 모델을 더 정직하게 만드는 방법"이라는 연구를 발표하며, 방금 내린 답변이 지시를 위반했는지, 부정행위였는지, 혹은 절차를 생략했는지 검토하기 위해 별도의 "고백 출력"을 모델에 추가하자고 제안했습니다. 연구팀은 GPT-5 Thinki...
OpenAI는 "고백을 통해 언어 모델을 더 정직하게 만드는 방법"이라는 연구를 발표하며, 방금 내린 답변이 지시를 위반했는지, 부정행위였는지, 혹은 절차를 생략했는지 검토하기 위해 별도의 "고백 출력"을 모델에 추가하자고 제안했습니다. 연구팀은 GPT-5 Thinki...
뉴욕 타임스 딜북 서밋에서 Anthropic의 CEO 다리오 아모데이는 최첨단 AI 기술이 점차 "성장하고 독특한 역량"이 되고 있다고 강조하며, 이러한 역량이 "독특한 국가 안보에 영향을 미친다"고 단호히 밝혔습니다. 그는 이 분야에서 민주주의 국가들이 책임 있는 거...
MIT 및 기타 기관의 연구진은 arXiv에 "Self-adapting Language Models"라는 논문을 발표하며, 배포 후 대규모 언어 모델이 "자기 편집" 메커니즘을 통해 가중치를 지속적으로 업데이트할 수 있도록 하는 적응형 언어 모델 프레임워크 SEAL을 ...
다트머스 대학은 Anthropic 및 Amazon Web Services(AWS)와 새로운 AI 파트너십을 발표하여 캠퍼스 전역에 생성형 AI 도구를 배포했으며, 이는 아이비리그 대학 중 최초로 기관 차원에서 대규모 기술을 도입한 사례가 되었습니다. 이 협업에는 교육 ...
텐센트의 훈위안 팀은 오픈소스 종단 간 OCR 전문가 모델 HunyuanOCR을 공식 출시했고, 첫 주에 Hugging Face 모델 트렌드 리스트 상위권에 진입했으며, 관련 플랫폼의 별과 다운로드 수가 빠르게 상승했습니다. 이 모델은 약 10억 개의 매개변수를 사용하...
Perplexity는 실제 웹 환경에서 AI 브라우저의 보안을 강화하기 위해 BrowseSafe 시스템과 그 동반 벤치마크인 BrowseSafe-Bench의 출시를 발표했습니다. 이 솔루션은 Comet 브라우저 시나리오를 대상으로 하며, 핵심은 웹 페이지 내 악성 자연...