UNO-Bench 全面解读:统一评测全模态理解与推理的开放基准

UNO-Bench 全面解读:统一评测全模态理解与推理的开放基准

一、摘要 UNO-Bench 是面向“单模/全模”统一评测的开源基准,覆盖感知与推理两大维度,提供中文真实场景题目与多步开放问答(MO)。数据与工具强调高质量、人为主导构建,并配套通用打分模型以便自动化评测。 二、核心特性 1、统一能力框架:44 类任务、5 种模态组合,单模与全模同一指标口径。 2...

Admin
96

推荐工具

更多