跳到主要内容

嵌入(Embedding)

LLM 能理解是向量化的东西。

优势: 基于语意做检索。传统的检索：基于关键字做匹配。

简单实现

将信息清洗，分段，Embedding 后存入向量数据库。
用户提问时，将用户提问 Embedding，匹配向量数据库中。
将匹配到到内容，选前几个（看具体 max token 的情况），拼成 Prompt。LLM 组织答案后返回。

细节的优化，对用户的提问和 LLM 的输出做了层处理后再返回。

具体可以看：基于大语言模型构建知识问答系统。

场景

多知识点

提问中包含多知识点时，Embedding-Search 召回精度较低的问题。比如：

皮蓬、英格利什和布兰德的身高、体重各是多少？
皮蓬、英格利什和布兰德谁的第一位置是 PF？
皮蓬、英格利什和布兰德谁的金徽章数最多？

本地知识建立索引时，通常对单个知识点进行 Embedding；不会也不可能，为不同知识点的排列组合分别制作索引。

解决方案：

识别用户意图，根据意图制定计划，执行计划。通过命名实体识别和槽位填充实现。
对信息做更多的索引。关键词，主题词检索；对相同知识点建立多级索引；把原始知识库转化为知识图谱。

详细说明：《LLM+Embedding构建问答系统的局限性及优化方案》

资源

【上集】向量数据库技术鉴赏
【下集】向量数据库技术鉴赏
LLM+Embedding构建问答系统的局限性及优化方案。作者小虫飞飞的另一篇文章：基于大语言模型构建知识问答系统

简单实现
场景
- 多知识点
资源