Bloom 开源工具解读:自动生成 LLM 行为评估,用 Seed 复现实验
一、摘要 Bloom 是一套开源的 LLM 行为评估生成框架:研究者只需定义“目标行为”和一份可复现的 Seed 配置,Bloom 会自动生成大量诱发场景并与目标模型交互,再由评审模型对行为出现频率与强度打分,输出可汇总的指标与报告,适合快速搭建可扩展的行为评测。 二、核心特性 1、以“行为”为中心...
Ai开源 • Admin •
47
找到 2 篇相关文章
一、摘要 Bloom 是一套开源的 LLM 行为评估生成框架:研究者只需定义“目标行为”和一份可复现的 Seed 配置,Bloom 会自动生成大量诱发场景并与目标模型交互,再由评审模型对行为出现频率与强度打分,输出可汇总的指标与报告,适合快速搭建可扩展的行为评测。 二、核心特性 1、以“行为”为中心...
Anthropic 于 2025 年 12 月 19 日发布 Bloom,并以开源形式提供下载与使用。Bloom 被定位为“自动化行为评估”的代理式框架:研究者先指定需要观测的单一行为特征,Bloom 再自动生成大量情境与对话回合,对目标模型在这些情境中的表现进行打分,输出诸如行为触发率与平均强度等...