학습 파이프라인은 대규모 모델 이후에 빌드됩니다.

找到 1 篇相关文章

GLM-4.5 开源 slime：高效 RL 训练框架全面解析

GLM-4.5 推出高效 RL 训练框架 slime，全面开源助力大规模模型优化清华大学知识工程实验室（THUDM）在发布 GLM-4.5 系列模型的同时，正式开源了自主研发的高效强化学习（RL）训练框架 slime。该框架专为大规模模型的后训练优化设计，目标是在保证训练效果的前提下，大幅提升推理与...

Ai开源 • Admin • 2025/8/11

학습 파이프라인은 대규모 모델 이후에 빌드됩니다.

GLM-4.5 开源 slime：高效 RL 训练框架全面解析

推荐工具

提交AI工具

请确认提交信息