向量数据库

💡
背景:假设我提了一个问题 Q,需要从一个知识文档库中找到相关的知识,那么我需要计算 文本转化为的向量之间的相似度。如何从百万级别的数据中,找到与某个向量相似度较高的几个向量呢,必须需要高效的检索。所以需要向量数据库。
 

各种向量数据库:

  • 倒排索引(传统数据库)
  • KNN
  • Approximate KNN
  • Product Quantization (PQ算法)
  • HSNW