Skip to main content

rag-mongo

该模板使用 MongoDB 和 OpenAI 执行 RAG。

环境设置

您应该导出两个环境变量,一个是您的 MongoDB URI,另一个是您的 OpenAI API KEY。如果您没有 MongoDB URI,请参阅底部的 Setup Mongo 部分以获取相关说明。

export MONGO_URI=...
export OPENAI_API_KEY=...

使用方法

要使用此包,您首先需要安装 LangChain CLI:

pip install -U langchain-cli

要创建一个新的 LangChain 项目并将此包作为唯一包安装,您可以执行:

langchain app new my-app --package rag-mongo

如果您想将其添加到现有项目中,只需运行:

langchain app add rag-mongo

并将以下代码添加到您的 server.py 文件中:

from rag_mongo import chain as rag_mongo_chain

add_routes(app, rag_mongo_chain, path="/rag-mongo")

如果您想设置一个摄取管道,可以将以下代码添加到您的 server.py 文件中:

from rag_mongo import ingest as rag_mongo_ingest

add_routes(app, rag_mongo_ingest, path="/rag-mongo-ingest")

(可选)现在让我们配置 LangSmith。 LangSmith 将帮助我们跟踪、监控和调试 LangChain 应用程序。 您可以在 这里 注册 LangSmith。 如果您没有访问权限,可以跳过此部分。

export LANGCHAIN_TRACING_V2=true
export LANGCHAIN_API_KEY=<your-api-key>
export LANGCHAIN_PROJECT=<your-project> # 如果未指定,默认为 "default"

如果您尚未连接到 Mongo 搜索索引,请在继续之前查看下面的 MongoDB 设置 部分。

如果您有要连接的 MongoDB 搜索索引,请编辑 rag_mongo/chain.py 中的连接详细信息。

如果您在此目录中,则可以直接启动 LangServe 实例:

langchain serve

这将启动 FastAPI 应用程序,服务器在本地运行,地址为 http://localhost:8000

我们可以在 http://127.0.0.1:8000/docs 查看所有模板 我们可以在 http://127.0.0.1:8000/rag-mongo/playground 访问游乐场

我们可以通过代码访问模板:

from langserve.client import RemoteRunnable

runnable = RemoteRunnable("http://localhost:8000/rag-mongo")

有关更多上下文,请参阅 此笔记本

MongoDB 设置

使用此步骤,如果您需要设置您的 MongoDB 账户并导入数据。我们将首先按照标准的 MongoDB Atlas 设置说明 这里 进行操作。

  1. 创建一个账户(如果尚未完成)
  2. 创建一个新项目(如果尚未完成)
  3. 找到您的 MongoDB URI。

这可以通过访问部署概览页面并连接到您的数据库来完成。

接下来,我们查看可用的驱动程序。

其中,我们将看到我们的 URI 列出。

然后将其设置为本地环境变量:

export MONGO_URI=...
  1. 让我们也为 OpenAI 设置一个环境变量(我们将其用作 LLM)。
export OPENAI_API_KEY=...
  1. 现在让我们导入一些数据!我们可以通过进入此目录并运行 ingest.py 中的代码来完成,例如:
python ingest.py

请注意,您可以(并且应该!)更改此内容以导入您选择的数据。

  1. 现在我们需要在我们的数据上设置一个向量索引。

我们可以首先连接到我们的数据库所在的集群。

然后我们可以导航到所有集合列出的地方。

接着我们可以找到我们想要的集合,并查看该集合的搜索索引。

那应该是空的,我们想要创建一个新的:

我们将使用 JSON 编辑器来创建它。

然后我们将粘贴以下 JSON:

 {
"mappings": {
"dynamic": true,
"fields": {
"embedding": {
"dimensions": 1536,
"similarity": "cosine",
"type": "knnVector"
}
}
}
}

从那里,点击“下一步”,然后点击“创建搜索索引”。这需要一点时间,但您应该会在您的数据上拥有一个索引!


此页面是否有帮助?


您还可以留下详细的反馈 在 GitHub 上