优化RAG知识库的实用攻略：从指令分离到智能推理

sinmucool

下面这篇文章给了一个优化基于RAG的AI知识库的思路
https://qwenlm.github.io/zh/blog/qwen-agent-2405/

指导聊天模型将用户查询中的指令信息与非指令信息分开。
tokens 解析文档，然后按照tokens 分布来拆分块儿。
向量和关键词检索的结果统一起来给到LLM进行回答。
可以尝试利用已有的智能体来做推理步骤

Image description

上述步骤针对单个的PDF检索也有效