QwenLong-L1.5 vs RAG:长文档多跳推理、数据合成与记忆代理对比 一、摘要 QwenLong-L1.5 是通义智文团队在 Qwen-Doc 仓库中开源的一套“长上下文推理 + 记忆管理”后训练方案(post-training recipe)。它围绕三件事展开:面向长文档的复杂推理数据合成、面向长序列的强化学习稳定训练方法(AEPO 等)、以及在超出物理上下文窗口时... Ai开源 • Admin • 2025/12/26 80