📄️ Activeloop Deep Lake
Activeloop Deep Lake 是一个多模态向量存储,能够存储嵌入及其元数据,包括文本、Json、图像、音频、视频等。它可以将数据保存在本地、云端或 Activeloop 存储中。它执行混合搜索,包括嵌入及其属性。
📄️ Aerospike
Aerospike Vector Search (AVS) 是对 Aerospike 数据库的扩展,能够在存储在 Aerospike 中的非常大数据集上进行搜索。这个新服务位于 Aerospike 之外,并构建一个索引以执行这些搜索。
📄️ 阿里云 OpenSearch
阿里云 Opensearch 是一个一站式平台,用于开发智能搜索服务。 OpenSearch 基于 Alibaba 开发的大规模分布式搜索引擎构建。 OpenSearch 为阿里巴巴集团的500多个业务案例和成千上万的阿里云客户提供服务。 OpenSearch 帮助在不同的搜索场景中开发搜索服务,包括电子商务、O2O、多媒体、内容行业、社区和论坛,以及企业的大数据查询。
📄️ AnalyticDB
AnalyticDB for PostgreSQL 是一项大规模并行处理 (MPP) 数据仓库服务,旨在在线分析大量数据。
📄️ Annoy
Annoy (Approximate Nearest Neighbors Oh Yeah) 是一个 C++ 库,具有 Python 绑定,用于搜索与给定查询点接近的空间中的点。它还创建了大型只读基于文件的数据结构,这些数据结构映射到内存中,以便多个进程可以共享相同的数据。
📄️ Apache Doris
Apache Doris 是一个现代化的数据仓库,用于实时分析。它能够对大规模的实时数据进行闪电般快速的分析。
📄️ ApertureDB
ApertureDB 是一个数据库,用于存储、索引和管理多模态数据,如文本、图像、视频、边界框和嵌入,以及它们相关的元数据。
📄️ Astra DB
本页面提供了使用 Astra DB 作为向量存储的快速入门指南。
📄️ Atlas
Atlas 是 Nomic 提供的一个平台,用于与小型和互联网规模的非结构化数据集进行交互。它使任何人都能够在浏览器中可视化、搜索和共享大量数据集。
📄️ AwaDB
AwaDB 是一个 AI 原生数据库,用于搜索和存储 LLM 应用程序使用的嵌入向量。
📄️ Azure Cosmos DB Mongo vCore
本笔记本展示了如何利用这个集成的 向量数据库 在集合中存储文档、创建索引,并使用近似最近邻算法(如 COS(余弦距离)、L2(欧几里得距离)和 IP(内积))执行向量搜索查询,以定位与查询向量接近的文档。
📄️ Azure Cosmos DB No SQL
本笔记本展示了如何利用这个集成的向量数据库在集合中存储文档,创建索引,并使用近似最近邻算法(如COS(余弦距离)、L2(欧几里得距离)和IP(内积))执行向量搜索查询,以定位与查询向量接近的文档。
📄️ Azure AI Search
Azure AI Search(以前称为 Azure Search 和 Azure Cognitive Search)是一种云搜索服务,为开发人员提供基础设施、API 和工具,以大规模检索向量、关键字和混合查询的信息。
📄️ 贝果
贝果 (Open Inference platform for AI),类似于 AI 数据的 GitHub。
📄️ BagelDB
BagelDB (开放向量数据库用于AI),就像AI数据的GitHub。
📄️ 百度云 ElasticSearch 向量搜索
百度云向量搜索 是一项完全托管的企业级分布式搜索和分析服务,100% 兼容开源。百度云向量搜索为结构化/非结构化数据提供低成本、高性能和可靠的检索与分析平台级产品服务。作为一个向量数据库,它支持多种索引类型和相似度距离方法。
📄️ 百度 VectorDB
Baidu VectorDB 是一款强大、企业级的分布式数据库服务,由百度智能云精心开发并全面管理。它以卓越的多维向量数据存储、检索和分析能力而脱颖而出。VectorDB 的核心基于百度自主研发的“Mochow”向量数据库内核,确保高性能、高可用性和安全性,同时具备出色的可扩展性和用户友好性。
📄️ Apache Cassandra
此页面提供了使用 Apache Cassandra® 作为向量存储的快速入门。
📄️ Chroma
Chroma 是一个以AI为原生的开源向量数据库,专注于开发者的生产力和幸福感。Chroma 采用 Apache 2.0 许可证。
📄️ Clarifai
Clarifai 是一个人工智能平台,提供完整的人工智能生命周期,包括数据探索、数据标注、模型训练、评估和推理。上传输入后,Clarifai 应用可以用作向量数据库。
📄️ ClickHouse
ClickHouse 是最快、资源效率最高的开源数据库,适用于实时应用和分析,支持完整的 SQL 及多种功能,帮助用户编写分析查询。最近添加的数据结构和距离搜索功能(如 L2Distance)以及 近似最近邻搜索索引 使 ClickHouse 能够作为高性能和可扩展的向量数据库,用于存储和搜索带有 SQL 的向量。
📄️ Couchbase
Couchbase 是一个屡获殊荣的分布式 NoSQL 云数据库,提供无与伦比的多功能性、性能、可扩展性和经济价值,适用于您的所有云、移动、人工智能和边缘计算应用程序。Couchbase 通过为开发人员提供编码辅助和为其应用程序提供向量搜索来拥抱人工智能。
📄️ DashVector
DashVector 是一个完全托管的向量数据库服务,支持高维稠密和稀疏向量、实时插入和过滤搜索。它具备自动扩展的能力,可以适应不同的应用需求。
📄️ Databricks 向量搜索
Databricks 向量搜索是一个无服务器的相似性搜索引擎,允许您在向量数据库中存储数据的向量表示,包括元数据。通过向量搜索,您可以从由 Unity Catalog 管理的 Delta 表中创建自动更新的向量搜索索引,并使用简单的 API 查询它们以返回最相似的向量。
📄️ DingoDB
DingoDB 是一个分布式多模态向量数据库,结合了数据湖和向量数据库的特性,可以存储任何类型和大小的数据(键值对、PDF、音频、视频等)。它具有实时低延迟处理能力,以实现快速洞察和响应,并能够高效地进行即时分析和处理多模态数据。
📄️ DocArray HnswSearch
DocArrayHnswSearch 是一个由 Docarray 提供的轻量级文档索引实现,完全在本地运行,最适合小型到中型数据集。它在 hnswlib 中将向量存储在磁盘上,并在 SQLite 中存储所有其他数据。
📄️ DocArray InMemorySearch
DocArrayInMemorySearch 是一个由 Docarray 提供的文档索引,它将文档存储在内存中。对于小型数据集,这是一个很好的起点,因为您可能不想启动一个数据库服务器。
📄️ Amazon Document DB
Amazon DocumentDB (与 MongoDB 兼容) 使您可以轻松地在云中设置、操作和扩展与 MongoDB 兼容的数据库。
📄️ DuckDB
本笔记本展示了如何将 DuckDB 用作向量存储。
📄️ 中国移动ECloud ElasticSearch VectorSearch
中国移动ECloud VectorSearch 是一项完全托管的企业级分布式搜索和分析服务。中国移动ECloud VectorSearch为结构化/非结构化数据提供低成本、高性能和可靠的检索与分析平台级产品服务。作为一个向量数据库,它支持多种索引类型和相似度距离方法。
📄️ Elasticsearch
Elasticsearch 是一个分布式的、基于REST的搜索和分析引擎,能够执行向量和词汇搜索。它建立在Apache Lucene库之上。
📄️ Epsilla
Epsilla 是一个开源的向量数据库,利用先进的并行图遍历技术进行向量索引。Epsilla 根据 GPL-3.0 许可证发布。
📄️ Faiss
Facebook AI Similarity Search (Faiss) 是一个用于高效相似性搜索和密集向量聚类的库。它包含可以在任意大小的向量集合中进行搜索的算法,甚至可以处理可能不适合 RAM 的向量集合。它还包含用于评估和参数调整的支持代码。
📄️ Faiss (Async)
Facebook AI Similarity Search (Faiss) 是一个用于高效相似性搜索和密集向量聚类的库。它包含可以在任意大小的向量集合中进行搜索的算法,甚至可以处理可能不适合 RAM 的向量集合。它还包含评估和参数调整的支持代码。
📄️ Google AlloyDB for PostgreSQL
AlloyDB 是一个完全托管的关系数据库服务,提供高性能、无缝集成和令人印象深刻的可扩展性。AlloyDB 与 PostgreSQL 100% 兼容。扩展您的数据库应用程序,构建利用 AlloyDB 的 Langchain 集成功能的 AI 驱动体验。
📄️ Google BigQuery 向量搜索
Google Cloud BigQuery 向量搜索 让您使用 GoogleSQL 进行语义搜索,使用向量索引以快速获取近似结果,或使用暴力搜索以获取精确结果。
📄️ Google Cloud SQL for MySQL
Cloud SQL 是一个完全托管的关系数据库服务,提供高性能、无缝集成和令人印象深刻的可扩展性。它提供 PostgreSQL、MySQL 和 SQL Server 数据库引擎。扩展您的数据库应用程序,利用 Cloud SQL 的 LangChain 集成构建 AI 驱动的体验。
📄️ Google Cloud SQL for PostgreSQL
Cloud SQL 是一项完全托管的关系数据库服务,提供高性能、无缝集成和令人印象深刻的可扩展性。它提供 PostgreSQL、PostgreSQL 和 SQL Server 数据库引擎。扩展您的数据库应用程序,利用 Cloud SQL 的 Langchain 集成功能构建 AI 驱动的体验。
📄️ Firestore
Firestore 是一个无服务器的文档导向数据库,能够根据需求进行扩展。扩展您的数据库应用程序,利用 Firestore 的 Langchain 集成构建 AI 驱动的体验。
📄️ Google Memorystore for Redis
Google Memorystore for Redis 是一个完全托管的服务,基于 Redis 内存数据存储构建应用程序缓存,提供亚毫秒的数据访问。扩展您的数据库应用程序,利用 Memorystore for Redis 的 Langchain 集成构建 AI 驱动的体验。
📄️ Google Spanner
Spanner 是一个高度可扩展的数据库,结合了无限的可扩展性和关系语义,如二级索引、强一致性、模式和 SQL,在一个简单的解决方案中提供 99.999% 的可用性。
📄️ Google Vertex AI 特征存储
Google Cloud Vertex 特征存储 通过让您以低延迟服务您的数据于 Google Cloud BigQuery,简化了您的 ML 特征管理和在线服务流程,包括执行嵌入的近似邻居检索的能力。
📄️ Google Vertex AI 向量搜索
本笔记本展示了如何使用与 Google Cloud Vertex AI 向量搜索 向量数据库相关的功能。
📄️ Hippo
Transwarp Hippo 是一个企业级云原生分布式向量数据库,支持大规模基于向量的数据集的存储、检索和管理。它有效解决了向量相似性搜索和高密度向量聚类等问题。Hippo 具有高可用性、高性能和易于扩展的特点。它拥有多种功能,如多种向量搜索索引、数据分区和分片、数据持久化、增量数据摄取、向量标量字段过滤和混合查询。它可以有效满足企业对大规模向量数据的高实时搜索需求。
📄️ Hologres
Hologres 是阿里云开发的统一实时数据仓库服务。您可以使用 Hologres 实时写入、更新、处理和分析大量数据。
📄️ Infinispan
Infinispan 是一个开源的键值数据网格,它可以作为单节点运行,也可以作为分布式系统运行。
📄️ Jaguar Vector Database
1. 它是一个分布式向量数据库
📄️ KDB.AI
KDB.AI 是一个强大的基于知识的向量数据库和搜索引擎,允许您通过提供先进的搜索、推荐和个性化功能,使用实时数据构建可扩展、可靠的 AI 应用程序。
📄️ Kinetica
Kinetica 是一个具有集成向量相似性搜索支持的数据库
📄️ LanceDB
LanceDB 是一个开源的向量搜索数据库,具有持久存储功能,极大简化了嵌入的检索、过滤和管理。完全开源。
📄️ Lantern
Lantern 是一个开源的 Postgres 向量相似性搜索工具
📄️ LLMRails
LLMRails 是一个用于构建 GenAI 应用程序的 API 平台。它提供了一个易于使用的 API,用于文档索引和查询,由 LLMRails 管理,并针对性能和准确性进行了优化。有关如何使用 API 的更多信息,请参见 LLMRails API 文档。
📄️ ManticoreSearch 向量存储
ManticoreSearch 是一个开源搜索引擎,提供快速、可扩展和用户友好的功能。它起源于 Sphinx Search 的一个分支,经过发展,融入了现代搜索引擎的特性和改进。ManticoreSearch 以其强大的性能和易于集成到各种应用程序中的特点而脱颖而出。
📄️ Marqo
本笔记本展示了如何使用与 Marqo 向量存储相关的功能。
📄️ Meilisearch
Meilisearch 是一个开源、快速且高度相关的搜索引擎。它提供了优秀的默认设置,帮助开发者构建流畅的搜索体验。
📄️ Amazon MemoryDB
Vector Search 介绍及 langchain 集成指南。
📄️ Milvus
Milvus 是一个数据库,用于存储、索引和管理由深度神经网络和其他机器学习(ML)模型生成的大规模嵌入向量。
📄️ Momento Vector Index (MVI)
MVI:最具生产力、最易于使用的无服务器向量索引,适用于您的数据。要开始使用 MVI,只需注册一个帐户。无需处理基础设施、管理服务器或担心扩展。MVI 是一项能够自动扩展以满足您需求的服务。
📄️ MongoDB Atlas
本笔记涵盖如何在 LangChain 中使用 langchain-mongodb 包进行 MongoDB Atlas 向量搜索。
📄️ MyScale
MyScale 是一个基于云的数据库,针对 AI 应用和解决方案进行了优化,建立在开源的 ClickHouse 之上。
📄️ Neo4j 向量索引
Neo4j 是一个开源图数据库,集成了向量相似性搜索的支持
📄️ NucliaDB
您可以使用本地的 NucliaDB 实例或使用 Nuclia Cloud。
📄️ OpenSearch
OpenSearch 是一个可扩展、灵活且可扩展的开源软件套件,用于搜索、分析和可观察性应用,采用 Apache 2.0 许可证。 OpenSearch 是一个基于 Apache Lucene 的分布式搜索和分析引擎。
📄️ Oracle AI 向量搜索:向量存储
Oracle AI 向量搜索旨在处理人工智能(AI)工作负载,它允许您基于语义而非关键词查询数据。
📄️ Pathway
Pathway 是一个开放的数据处理框架。它使您能够轻松开发与实时数据源和变化数据一起工作的 数据转换管道和机器学习应用程序。
📄️ Postgres 嵌入
Postgres 嵌入 是一个开源向量相似性搜索工具,适用于 Postgres,使用 Hierarchical Navigable Small Worlds (HNSW) 进行近似最近邻搜索。
📄️ PGVecto.rs
本笔记本展示了如何使用与Postgres向量数据库(pgvecto.rs)相关的功能。
📄️ PGVector
使用 postgres 作为后端并利用 pgvector 扩展实现的 LangChain 向量存储抽象。
📄️ Pinecone
Pinecone 是一个功能广泛的向量数据库。
📄️ Qdrant
Qdrant(读作 quadrant)是一个向量相似性搜索引擎。它提供了一个生产就绪的服务,具有方便的 API 来存储、搜索和管理向量,并支持附加负载和扩展过滤。这使得它在各种神经网络或基于语义的匹配、分面搜索及其他应用中非常有用。
📄️ Redis
Redis 向量数据库 介绍及 langchain 集成指南。
📄️ Relyt
Relyt 是一项云原生数据仓库服务,旨在在线分析大量数据。
📄️ Rockset
Rockset 是一个为云而构建的实时搜索和分析数据库。Rockset 使用 Converged Index™ 和高效的向量嵌入存储,以支持低延迟、高并发的搜索查询。Rockset 完全支持元数据过滤,并处理实时摄取以应对不断更新的流数据。
📄️ SAP HANA Cloud Vector Engine
SAP HANA Cloud Vector Engine 是一个完全集成到 SAP HANA Cloud 数据库中的向量存储。
📄️ ScaNN
ScaNN(可扩展最近邻)是一种用于大规模高效向量相似性搜索的方法。
📄️ SemaDB
SemaDB 来自 SemaFind,是一个简单易用的向量相似度数据库,用于构建 AI 应用程序。托管的 SemaDB Cloud 提供了一个简单的开发者体验,以便快速入门。
📄️ SingleStoreDB
SingleStoreDB 是一个强大、高性能的分布式 SQL 数据库解决方案,旨在在 云 和本地环境中表现出色。它拥有多功能的特性集,提供无缝的部署选项,同时提供无与伦比的性能。
📄️ scikit-learn
scikit-learn 是一个开源的机器学习算法集合,包括一些 k 最近邻 的实现。 SKLearnVectorStore 封装了这个实现,并增加了将向量存储持久化为 json、bson(二进制 json)或 Apache Parquet 格式的可能性。
📄️ SQLite-VSS
SQLite-VSS 是一个为向量搜索而设计的 SQLite 扩展,强调本地优先操作,并且可以轻松集成到没有外部服务器的应用程序中。利用 Faiss 库,它提供高效的相似性搜索和聚类能力。
📄️ StarRocks
StarRocks 是一个高性能分析数据库。
📄️ Supabase (Postgres)
Supabase 是一个开源的 Firebase 替代品。Supabase 构建在 PostgreSQL 之上,提供强大的 SQL 查询能力,并与现有工具和框架实现简单接口。
📄️ SurrealDB
SurrealDB 是一个端到端的云原生数据库,旨在满足现代应用程序的需求,包括网页、移动端、无服务器、Jamstack、后端和传统应用程序。使用 SurrealDB,您可以简化数据库和 API 基础设施,减少开发时间,并快速且经济高效地构建安全、高性能的应用程序。
📄️ Tair
Tair 是由 Alibaba Cloud 开发的云原生内存数据库服务。它提供丰富的数据模型和企业级功能,以支持您的实时在线场景,同时与开源 Redis 完全兼容。Tair 还引入了基于新型非易失性存储介质 (NVM) 的持久内存优化实例。
📄️ 腾讯云 VectorDB
腾讯云 VectorDB 是一款完全托管、自主研发的企业级分布式数据库服务,旨在存储、检索和分析多维向量数据。该数据库支持多种索引类型和相似度计算方法。单个索引可以支持高达 10 亿的向量规模,并能够支持数百万的 QPS 和毫秒级的查询延迟。腾讯云向量数据库不仅可以为大型模型提供外部知识库,以提高大型模型响应的准确性,还可以广泛应用于推荐系统、自然语言处理服务、计算机视觉和智能客服等 AI 领域。
📄️ ThirdAI NeuralDB
NeuralDB 是由 ThirdAI 开发的友好于 CPU 且可精细调优的向量存储。
📄️ TiDB Vector
TiDB Cloud 是一个全面的数据库即服务(DBaaS)解决方案,提供专用和无服务器选项。TiDB Serverless 现在在 MySQL 生态系统中集成了内置的向量搜索。通过这一增强功能,您可以无缝地使用 TiDB Serverless 开发 AI 应用,而无需新的数据库或额外的技术栈。在 https://pingcap.com/ai 创建一个免费的 TiDB Serverless 集群,开始使用向量搜索功能。
📄️ Tigris
Tigris 是一个开源的无服务器 NoSQL 数据库和搜索平台,旨在简化构建高性能向量搜索应用程序的过程。
📄️ TileDB
TileDB 是一个强大的引擎,用于索引和查询密集和稀疏的多维数组。
📄️ Timescale Vector (Postgres)
Timescale Vector 是用于 AI 应用的 PostgreSQL++ 向量数据库。
📄️ Typesense
Typesense 是一个开源的内存搜索引擎,您可以选择 自托管 或在 Typesense Cloud 上运行。
📄️ Upstash Vector
Upstash Vector 是一个无服务器的向量数据库,旨在处理向量嵌入。
📄️ USearch
USearch 是一个更小、更快的单文件向量搜索引擎
📄️ Vald
Vald 是一个高度可扩展的分布式快速近似最近邻(ANN)稠密向量搜索引擎。
📄️ 英特尔的视觉数据管理系统 (VDMS)
英特尔的 VDMS 是一个用于高效访问大“视觉”数据的存储解决方案,旨在通过搜索存储为图的相关视觉数据的视觉元数据来实现云规模,并为视觉数据启用机器友好的增强,以便更快地访问。VDMS 采用 MIT 许可证。
📄️ Vearch
Vearch 是深度学习和人工智能应用的向量搜索基础设施。
📄️ Vectara
Vectara 提供了一个可信的生成式 AI 平台,允许组织快速创建类似 ChatGPT 的体验(一个 AI 助手),其基础是他们拥有的数据、文档和知识(从技术上讲,它是检索增强生成即服务)。
📄️ Vespa
Vespa 是一个功能齐全的搜索引擎和向量数据库。它支持向量搜索(ANN)、词汇搜索以及结构化数据搜索,所有这些都可以在同一个查询中进行。
📄️ viking DB
viking DB 是一个存储、索引和管理由深度神经网络和其他机器学习(ML)模型生成的大规模嵌入向量的数据库。
📄️ vlite
VLite 是一个简单且快速的向量数据库,允许您使用嵌入以语义方式存储和检索数据。Vlite 采用 numpy 制作,是一个轻量级的全功能数据库,可以将 RAG、相似性搜索和嵌入集成到您的项目中。
📄️ Weaviate
本笔记本介绍如何在 LangChain 中使用 langchain-weaviate 包开始使用 Weaviate 向量存储。
📄️ Xata
Xata 是一个基于 PostgreSQL 的无服务器数据平台。它提供了一个用于与数据库交互的 Python SDK,以及一个用于管理数据的用户界面。
📄️ Yellowbrick
Yellowbrick 是一个弹性、具备大规模并行处理 (MPP) 的 SQL 数据库,能够在云端和本地运行,利用 Kubernetes 实现扩展性、弹性和云端可移植性。Yellowbrick 的设计旨在解决最大和最复杂的业务关键数据仓库用例。Yellowbrick 提供的高效扩展性使其能够作为高性能和可扩展的向量数据库,使用 SQL 存储和搜索向量。
📄️ Zep
回顾、理解并提取聊天记录中的数据。赋予个性化AI体验强大功能。
📄️ Zep Cloud
回忆、理解并提取聊天记录中的数据。为个性化的AI体验提供动力。
📄️ Zilliz
Zilliz Cloud 是一个完全托管的 LF AI Milvus® 云服务,