GLM-4.5 开源 slime:高效 RL 训练框架全面解析 GLM-4.5 推出高效 RL 训练框架 slime,全面开源助力大规模模型优化清华大学知识工程实验室(THUDM)在发布 GLM-4.5 系列模型的同时,正式开源了自主研发的高效强化学习(RL)训练框架 slime。该框架专为大规模模型的后训练优化设计,目标是在保证训练效果的前提下,大幅提升推理与... Ai开源 • Admin • 2025/8/11 13