图谱增强RAG:医疗诊断助手
更新时间:2025-09-19
本文介绍了如何利用知识库的图谱增强能力,借助知识图谱技术实现多实体、多关系知识之间的关联整合,使得大模型在问答阶段生成具有因果依赖关系的回答。
文章以医疗诊断助手为例,演示了图谱增强RAG问答助手的实现过程,并与传统RAG问答方法进行了对比。
能力介绍
图谱增强RAG是在传统 RAG 框架基础上引入知识图谱(Knowledge Graph, KG)来增强信息检索和生成质量的一种改进方案。它将图结构引入文本索引和检索,采用双层检索系统,从低到高全面覆盖信息;同时它还能快速更新数据,保持实时高效的响应。
图谱增强RAG的工作流程如下图所示: 总体来说,先进行图基文本索引、实体和关系提取,完成知识预处理与索引构建;接着去重优化、利用 LLM 生成键值对,实现知识优化准备;然后生成查询关键词,通过双层检索范式和关键词匹配开展检索;再整合上下文,让系统快速适应增量知识库;最后基于整合知识,由生成模型产出结果。
功能优势
图谱增强RAG嵌入结构化知识,有助于提升复杂推理、上下文理解、多跳问答等场景下的准确度与解释性。
| 行业 | 场景 | 传统RAG症结 | 图谱增强RAG优势 |
|---|---|---|---|
| 金融、制造 | 上下游依赖与传导分析 | 仅检索某个实体本身,缺乏系统性影响分析 | 支持供应链、生态链、组织结构等上下游视角 |
| 金融 | 时间序列与演化过程问答 | 难以处理“时间节点变化”“状态演进” | 可维护时间戳属性边 |
| 金融、医疗 | 可解释性与合规要求场景 | 只能提供片段证据,不展示关系脉络 | 能输出“关系路径+证据链” |
选型建议
✅ 建议场景:复杂因果/依赖/关系推理、多跳问答、可解释性要求高、知识庞杂且动态。
❌ 不建议用于:简单检索问答、关系稀疏、数据少且稳定、极高实时性要求。在这几类场景中图谱增强RAG往往提升有限甚至徒增复杂度与资源消耗
最佳实践:医疗诊断智能体
| 应用场景 | 为什么传统RAG解决不了? | 图谱增强RAG的优势 |
|---|---|---|
| 医疗诊断助手: 患者信息、过往病史、药物副作用、临床试验分析等知识之间隔离严重,即便是资深医生在进行医疗诊断时,也难以捕捉不同信息之间的关联属性,给医疗诊断带来极大不便。 |
仅依赖向量或全文检索,结果是“片段式”的。 缺乏全局关联,难以理解不同信息之间的逻辑关系。 在复杂问答、推理、因果分析、关系追踪时效果不足。 |
全局关联,理解逻辑关系:能够从全局视角出发,清晰把握患者过往病史、药物副作用之间的逻辑关联,更好地理解知识体系中各部分的内在联系。 提升复杂场景表现:在复杂问答、推理、因果分析以及关系追踪等场景下,能更精准、高效地发挥作用,有效应对传统 RAG 在这些方面效果不足的问题。 增强语义理解深度:借助图谱的结构,可深入挖掘语义层面的信息,让对内容的理解不仅仅停留在表面,能捕捉到更丰富、更深入的语义内涵。 |
操作步骤
Step 1: 上传数据文档
- 在 创建知识库 - 配置选择 中,开启知识图谱。 完整创建知识库流程可查看创建知识库。
- 在知识库详情界面,可通过知识图谱查看知识之间的联系
- 知识图谱的展示效果参考如下:
Step 2: 命中测试
知识库创建后,您可在命中测试页面输入查询Query(图搜图功能敬请期待)。系统将返回与之相关的知识库图片或图文混排内容。展示效果如下:
| 图谱增强RAG示例 | 传统RAG示例 |
|---|---|
![]() |
![]() |
效果对比:
- 传统 RAG:只能召回关联的文本切片,却形成知识隔离,不能构建跨文档信息之间的关联。
- 图谱增强 RAG:检索召回的信息间形成关联,捕捉到实体之间的逻辑性,定位更精准,节约了输入大模型的消耗tokens。
Step 3: 智能体调用
您可在自主规划Agent 中调用已创建的图谱增强知识库,实现知识图谱关联的图文混排智能回答或内容生成:
| Agent类型 | 图谱增强RAG 示例 | 图谱详情展示 | 传统 RAG 示例 | 效果 |
|---|---|---|---|---|
| 自主规划 Agent | ![]() |
![]() |
![]() |
在检索配置中开启知识图谱检索时,除了检索语义相似的原文切片,还能进行图检索,为大模型注入结构化信息(实体和关系)。 传统的RAG只能检索相似语义,难以捕捉实体之间的逻辑性和关联性。 完整流程参考自主规划Agent。 |
- 借助图谱增强RAG架构、加入知识图谱增强进行知识问答,能够更清晰地捕捉实体属性之间的依赖关系,而在传统RAG检索问答的方法中,这部分内容往往受限于传统架构无法构建知识关系网。





