Bloom 开源工具解读:自动生成 LLM 行为评估,用 Seed 复现实验

Bloom 开源工具解读:自动生成 LLM 行为评估,用 Seed 复现实验

一、摘要 Bloom 是一套开源的 LLM 行为评估生成框架:研究者只需定义“目标行为”和一份可复现的 Seed 配置,Bloom 会自动生成大量诱发场景并与目标模型交互,再由评审模型对行为出现频率与强度打分,输出可汇总的指标与报告,适合快速搭建可扩展的行为评测。 二、核心特性 1、以“行为”为中心...

Admin
49

推荐工具

更多