文档菜单
文档主页
/
MongoDB地图集

Atlas矢量搜索概述

在本页上

  • 什么是向量搜索?
  • 关键概念
  • Atlas矢量搜索索引
  • Atlas矢量搜索查询
  • 用例
  • AI集成

您可以使用Atlas Vector Search对中的数据执行矢量搜索阿特拉斯在集合上定义Atlas Vector Search索引时,可以将矢量数据与其他数据无缝索引,然后对索引字段执行向量搜索查询。

Atlas Vector Search支持各种搜索用例,包括语义搜索、混合搜索和生成搜索。通过存储向量嵌入与您的其他数据一起阿特拉斯,可以在其他字段上筛选语义搜索查询并将语义搜索与全文搜索相结合。此外,您可以在中利用Atlas Vector Search人工智能应用程序和集成它很受欢迎人工智能框架和服务。

支持Atlas Vector Search阿特拉斯集群正在运行MongoDB 6.0.11、7.0.2或更高版本。

Atlas矢量搜索入门

注释

为了获得最佳性能,我们建议部署单独搜索用于工作负载隔离的节点.搜索节点支持并发查询执行以改进单个查询延迟。要了解更多信息,请参阅查看部署选项

矢量搜索是一种搜索方法,它返回基于数据的语义或潜在含义。不同于传统全文搜索查找文本匹配项,向量搜索查找向量接近您的搜索查询在多维空间中。向量离查询越近,它们的含义越相似。

通过解释搜索查询和数据的含义,向量搜索允许您考虑搜索者的意图和搜索上下文以检索更相关的结果。

例如,如果搜索术语“red fruit”,则全文搜索仅返回明确包含这些关键字的数据。然而,语义搜索可能会返回含义相似的数据,例如苹果或草莓等红色水果。

矢量

向量是表示数据的数字数组在多个维度中。矢量可以表示任何类型的数据,从文本、图像和音频数据到非结构化数据。语义的相似度是通过测量向量。

具体来说,Atlas Vector Search使用密集向量,这是一种高维向量较小的存储和语义丰富性。与稀疏向量相反,密集向量可以包含更多数据,这使得Atlas Vector Search能够捕获更复杂的关系。

向量嵌入

矢量嵌入或矢量化是转换的过程将数据转换为向量。您可以通过传递数据来创建这些嵌入通过嵌入模型,还有你将这些嵌入作为字段存储在阿特拉斯收藏。

Atlas矢量搜索通过识别距离最近的向量嵌入您的查询向量。要了解更多信息,请参阅地图集矢量搜索查询

嵌入模型

嵌入模型是转换复杂数据的算法变成矢量。为此,嵌入模型使用法学硕士s、 机器在大型数据集上训练学习模型,以生成封装数据语义的向量嵌入。

这些嵌入使Atlas Vector Search能够更好地理解数据中的关系并执行以下任务语义搜索和检索。根据您的数据和任务,不同的嵌入模型提供不同的优势。

要在中对数据执行矢量搜索阿特拉斯,您必须创建Atlas矢量搜索索引。Atlas Vector Search索引独立于其他数据库索引和用于高效检索包含查询时的向量嵌入。在Atlas Vector Search索引定义中,对集合中包含嵌入的字段进行索引对这些字段启用矢量搜索。Atlas Vector Search支持嵌入宽度小于等于4096维。

您还可以通过索引任何集合中的布尔、字符串、日期和数字字段要对其运行Atlas Vector Search查询的。过滤数据可以缩小搜索并确保某些向量嵌入不考虑进行比较。

要了解如何为Atlas Vector Search索引字段,看见如何为向量搜索索引字段

Atlas矢量搜索支持近似最近邻居(人工神经网络)搜索使用分层导航小世界算法。人工神经网络通过以下方式优化速度多维中最相似向量的近似不扫描每个矢量的空间。这种方法尤其用于从大型矢量数据集检索数据。

Atlas矢量搜索查询包括聚合管道阶段其中$vectorSearch($vector搜索)阶段是管道中的第一阶段。基本Atlas矢量搜索查询的过程如下所示:

  1. 您可以指定查询向量,这是表示搜索查询的向量嵌入。

  2. Atlas Vector Search使用人工神经网络搜索以查找数据中的向量嵌入最接近查询向量的。

  3. Atlas Vector Search返回包含最相似向量的文档。

要自定义矢量搜索查询,可以在通过使用MQL公司匹配支持的表达式比较聚合运算符,或者您可以添加其他聚合阶段进一步处理和组织结果。

要了解如何创建和运行Atlas Vector Search查询,看见运行矢量搜索查询

Atlas Vector Search支持以下类型的矢量搜索查询:

通过使用阿特拉斯作为一个矢量数据库,您可以使用Atlas Vector Search构建自然语言处理(NLP)、机器学习(ML)等,和生成人工智能应用。

具体来说,您可以实现检索增强生成(RAG)通过将数据存储在阿特拉斯,使用Atlas Vector Search检索相关数据中的文档,并利用法学硕士回答问题根据您的数据。你可以实施RAG公司本地或通过集成流行的Atlas矢量搜索框架和服务。要了解更多信息,请参阅人工智能关键概念

您可以将Atlas Vector Search与流行的聊天和嵌入模型一起使用人工智能OpenAI等提供商,美国焊接学会和谷歌。MongoDB和合作伙伴还为帮助您在生成中利用Atlas Vector Search人工智能人工智能-有动力的应用程序。这些集成包括内置工具和库使您能够构建应用程序并实现RAG公司从开始到完成。

例如,通过将Atlas Vector Search与开源框架集成例如LangChain公司拉马指数,您可以回答问题关于您的热门数据法学硕士第条。

要了解更多信息并开始使用,请参阅将矢量搜索与AI技术集成

 地图集搜索变更日志