💡背景:假设我提了一个问题 Q,需要从一个知识文档库中找到相关的知识,那么我需要计算 文本转化为的向量之间的相似度。如何从百万级别的数据中,找到与某个向量相似度较高的几个向量呢,必须需要高效的检索。所以需要向量数据库。 各种向量数据库:倒排索引(传统数据库)KNNApproximate KNNProduct Quantization (PQ算法)HSNW