返回AI百科
什么是 RAG?

什么是 RAG?

AI百科 Admin 162 次浏览


一、定义:什么是 RAG

RAG 全称为 Retrieval-Augmented Generation,即检索增强生成技术。它是一种将大型语言模型(LLM)与外部知识库结合的 AI 模型架构,使模型能够在生成回答之前检索相关信息。


二、RAG 的工作流程

  1. 索引阶段:将文本或文档转成向量表示,并存储在向量数据库中;
  2. 检索阶段:用户提问时,系统将查询也转成向量,并检索数据库中相关内容;
  3. 增强阶段:将检索到的信息拼接进提示(prompt)中,作为生成的上下文;
  4. 生成阶段:语言模型基于原始训练数据与检索到的上下文共同生成回答。


三、RAG 的主要优势

  • 减少“幻觉”:可引用外部可靠资料,模型生成的答案更可信;
  • 即时更新知识:无需频繁重训练,即可迅速补充新信息;
  • 支持定制化应用:可接入企业内部文档库,为领域任务提供高准确率输出。


四、典型应用场景

  • 企业客服机器人通过接入公司文档系统提供准确政策回答;
  • 知识问答系统调用行业报告、法规、用户手册等数据生成答案;
  • 教育平台检索最新资料生成精准解答。


五、总结

RAG 是一种能让 LLM 利用外部知识库实时补充信息的生成方式,使得回答更准确、内容可追溯、适应性更强。它已成为企业定制 AI 服务的重要技术方案。

推荐工具

更多