OpenAI 推出 IndQA 基准:面向印度语言与文化的“情境与推理”评测集 OpenAI 于 2025 年 11 月 3 日发布 IndQA,这是一个用于评估AI系统在印度语言与文化上的理解与推理的新基准。官方称,现有多语种评测(如 MMMLU、MGSM)趋于“高分聚集”,且多偏翻译或选择题,难以反映真实使用中的文化与语境理解。IndQA 因此由本土专家以母语撰写问题,覆盖... AI资讯 • Admin • 2025/11/5 81