Selon la liste des modèles mise à jour par le Baidu Intelligent Cloud Qianfan AI Application Developer Center le 12 novembre 2025, Wenxin 5.0 (ERNIE 5.0) est apparu dans la zone de recommandation en tant que « modèle phare » et est clairement décrit comme un « modèle Wenxin de nouvelle génération » et un « grand modèle natif full-modal ». Le document indique que Wenxin 5.0 adopte la technologie native de modélisation unifiée omnimodale pour modéliser conjointement du texte, des images, de l’audio et de la vidéo, et dispose de capacités omnimodales complètes, de sorte que l’expression « modèle fondamental omnimodal natif » est fondamentalement cohérente avec le positionnement technique officiel.
La description des capacités de Wenxin 5.0 sur la même page comprend : les capacités de base ont été entièrement mises à niveau, les performances globales dans les benchmarks ont été améliorées par rapport à la génération précédente, et la compréhension multimodale, le suivi des instructions, l’écriture créative, la factualité, la planification des agents et l’application de l’outil sont « particulièrement bons », et la longueur du contexte a été étendue à 64K ou 128K pour mieux prendre en charge la compréhension de documents longs et le raisonnement complexe. Cela est cohérent avec la connotation de slogans tels que « bon pour la compréhension intégrale modale, l’écriture créative et le suivi d’instructions ». Cependant, les noms de points d’accès actuels qui peuvent être appelés sur la plate-forme Qianfan sont « ERNIE-5.0-Thinking-Preview » et « ernie-5.0-thinking-latest », et le blog officiel d’ERNIE est toujours basé sur « ERNIE-5.0-Preview-1022 », soulignant qu’il est en cours de test sur LMArena et prévoit de « le publier officiellement dans un avenir proche », indiquant qu’il est toujours en phase de prévisualisation et d’ouverture progressive. plutôt que complètement universel.
En ce qui concerne l’engagement à « continuer à investir et à développer des modèles plus avancés pour promouvoir les limites de l’intelligence », Baidu a réitéré à plusieurs reprises ces dernières années dans des rapports financiers, des livres blancs techniques et de nombreuses conférences de presse qu’elle augmentera les investissements en R&D dans les grands modèles, les puces de base Kunlun et l’infrastructure d’IA pendant longtemps, et des rapports externes le considèrent également comme un objectif stratégique pour la croissance future de l’entreprise. À en juger par les informations publiques, ce type de déclaration est un énoncé de stratégie d’entreprise continu, et non un nouvel engagement isolé. Sur la base de plusieurs sources, il peut être déterminé qu’ERNIE 5.0 se positionne comme une nouvelle génération de modèle de base natif full-modal de Wenxin, et son auto-évaluation de la compréhension multimodale, de l’écriture créative, du suivi d’instructions et d’autres capacités est cohérente avec la documentation technique officielle, mais il est toujours au stade de « Aperçu/ouverture progressive », et la portée spécifique et le calendrier de l’ouverture complète doivent encore être officiellement annoncés ultérieurement.
FAQ Q : ERNIE 5.0est-il
vraiment sorti ?
R : La documentation de Baidu Qianfan a répertorié Wenxin 5.0 comme le modèle phare et fournit le point d’accès « ERNIE-5.0-Thinking-Preview / -latest », tandis que le blog officiel d’ERNIE mentionne que « ERNIE-5.0-Preview-1022 » est testé sur LMArena et sera « officiellement publié dans un avenir proche ». On peut considérer que le modèle est entré dans la phase d’avant-première et de test ouvert, mais il n’est pas tout à fait clair s’il est entièrement ouvert à tous les utilisateurs et si la stratégie commerciale spécifique est spécifique.
Q : L’expression « modèle fondamental » est-elle fiable ?
R : La page officielle de Qianfan indique clairement que « Wenxin 5.0 est un grand modèle natif full-modal », et explique que l’utilisation de la technologie de modélisation unifiée pour modéliser conjointement du texte, des images, de l’audio et de la vidéo est positionnée comme un modèle général de base plutôt que seulement pour une certaine scène verticale, de sorte que l’affirmation du « modèle fondamental nativement omnimodal » est fondamentalement cohérente avec le positionnement officiel.
Q : Est-ce qu’il se « démarque » vraiment dans la compréhension multimodale, l’écriture créative et le suivi d’instructions ?
R : Le document original de Baidu indique que Wenxin 5.0 fonctionne « particulièrement bien » en matière de compréhension multimodale, de conformité des instructions, d’écriture créative, de factualité et de planification des agents et d’application des outils, et souligne que les résultats de référence sont meilleurs que ceux de la génération précédente. Il s’agit encore de résultats autodéclarés par les fabricants, et les évaluations externes indépendantes proviennent actuellement principalement de plateformes telles que les classements LMArena, qui sont toujours en cours de vérification continue.
Q : Comment ERNIE 5.0 est-il maintenant disponible pour les développeurs généralistes ?
R : Actuellement, l’accès à l’API est fourni sous la forme de « ERNIE-5.0-Thinking-Preview/Latest » via la plateforme Baidu Intelligent Cloud Qianfan, qui s’adresse aux entreprises et aux développeurs. Il peut y avoir des différences entre les comptes, les régions et les politiques de facturation, et nous n’avons pas encore vu de description de politique unifiée qui soit « entièrement gratuite et entièrement ouverte à tous les utilisateurs finaux ».
Q : Est-ce que le « continuera à investir dans des modèles de pointe » de Baidu est un vain mot ou est-ce vraiment basé ?
R : Baidu continue de divulguer ses investissements intensifs dans la recherche et le développement de l’IA, y compris les grands modèles, les puces d’IA, les plateformes de puissance de calcul et les solutions industrielles, dans des rapports financiers, des livres blancs sur les brevets et de nombreuses conférences, et les dépenses cumulées de R&D liées à l’IA au fil des ans ont atteint des centaines de milliards de yuans en données publiques. Combiné aux déclarations de la dernière conférence mondiale et de la Cloud Intelligence Conference, « continuer à augmenter les investissements et à repousser les limites de l’intelligence » fait partie de sa ligne stratégique à long terme, et non d’un slogan publicitaire ponctuel.