建筑文学法律宗教等十领域

找到 1 篇相关文章

OpenAI 推出 IndQA 基准：面向印度语言与文化的“情境与推理”评测集

OpenAI 于 2025 年 11 月 3 日发布 IndQA，这是一个用于评估AI系统在印度语言与文化上的理解与推理的新基准。官方称，现有多语种评测（如 MMMLU、MGSM）趋于“高分聚集”，且多偏翻译或选择题，难以反映真实使用中的文化与语境理解。IndQA 因此由本土专家以母语撰写问题，覆盖...

AI资讯 • Admin • 2025/11/5

建筑文学法律宗教等十领域

OpenAI 推出 IndQA 基准：面向印度语言与文化的“情境与推理”评测集

推荐工具

提交AI工具

请确认提交信息