Mistral AI는 Mistral 3라는 차세대 모델 계열을 발표했으며, 여기에는 스페어스 전문가 하이브리드 아키텍처를 위한 Mistral Large 3와 로컬 및 엣지 시나리오를 위한 Ministral 3 시리즈(3B, 8B, 14B)가 포함됩니다. 공식 소개에 따르면, Large 3는 약 41B 활성화 매개변수와 675B 총 매개변수의 MoE 구조를 채택하여, 일반 지시 과제, 다국어 대화 및 이미지 이해 분야에서 현재 오픈 가중치 모델의 선도 수준에 도달합니다.
Ministral 3 시리즈는 또한 기본, 지시, 추론 변형을 제공하며, 다중 모드 및 다국어 지원을 제공하며, 동일 작업에 대해 적은 토큰을 출력하고 더 나은 성능 대비 비용 비율을 달성하는 데 중점을 둡니다. 그중 14B 추론 버전은 AIME 2025와 같은 추론 벤치마크에서 유사한 규모의 모델 중에서 선도적인 성과를 거두었습니다. Mistral은 또한 NVIDIA, vLLM, Red Hat 등 생태계와 협력하여 Mistral 3 계열을 위한 TensorRT-LLM, SGLang 같은 추론 최적화를 제공하고, Blackwell, Hopper GPU, RTX PC, Jetson 기기에서 효율적인 배포 경로를 제공하여 데이터 센터에서 로봇 및 엣지 단말기로 모델을 확장할 수 있도록 합니다.
Mistral 3는 현재 Mistral AI Studio, Amazon Bedrock, Azure Foundry, Hugging Face, Modal, IBM watsonx, OpenRouter, Fireworks, Unsloth AI, Together AI 등 다양한 플랫폼에서 이용 가능하며, NVIDIA NIM과 AWS에서도 출시될 계획입니다 세이지메이커. Mistral은 도메인 특화 요구를 가진 조직을 위해 맞춤형 모델 구축과 엔터프라이즈 레벨 배포를 위한 맞춤형 교육 서비스도 제공합니다.
자주 묻는
질문: Mistral 3 모델 계열은 무엇인가요?
답변: Mistral 3는 Mistral AI가 출시한 신세대 모델 시리즈로, 대규모 Mistral Large 3와 Ministral 3(3B, 8B, 14B)를 포함해 로컬 및 엣지 시나리오를 지원합니다.
Q: 미스트랄 라지 3의 기술적 특징은 무엇인가요?
A: Large 3는 약 41B 활성 매개변수와 675B 총 매개변수를 가진 희소한 MoE 아키텍처를 채택하며, 이미지 이해와 다국어 대화를 지원하며 오픈 소스 명령어 모델 중 선도 수준에 위치합니다.
Q: 미니스트랄 3 시리즈의 주요 응용 분야는 무엇인가요?
A: Ministral 3는 로컬 및 엣지 배포에 중점을 두며, 토큰 생성을 줄이면서도 효과성을 보장하기 위한 기반, 지시, 추론 변형을 제공하여 자원이 제한된 환경에서 추론 및 다중 모달 응용에 적합합니다.
Q: 이 모델들은 어떻게 라이선스를 받나요?
A: Mistral Large 3와 Ministral 3의 기본 및 지시적 버전은 Apache 2.0 라이선스 하에 오픈 소스되어 있어 기업들이 컴플라이언스를 명분으로 세밀 조정, 배포, 상용화하기 쉽게 할 수 있습니다.
Q: 현재 Mistral 3는 어디에서 사용되고 배치될 수 있나요?
A: 자체 Mistral AI Studio에서 API를 제공하는 것 외에도, Mistral 3는 Amazon Bedrock, Azure Foundry, Hugging Face 등 여러 클라우드 및 개발 플랫폼에 통합되어 있으며, NVIDIA NIM과 AWS SageMaker로도 확장할 계획입니다.