Skip to main content

Clarifai

Clarifai 是最早的深度学习平台之一,成立于2013年。Clarifai 提供一个涵盖数据探索、数据标注、模型训练、评估和推理的完整 AI 生命周期的平台,支持图像、视频、文本和音频数据。在 LangChain 生态系统中,据我们所知,Clarifai 是唯一一个在一个生产规模的平台上支持 LLM、嵌入和向量存储的提供商,使其成为将 LangChain 实现投入生产的绝佳选择。

安装与设置

  • 安装 Python SDK:
pip install clarifai

注册一个 Clarifai 账户,然后从你的 安全设置 获取个人访问令牌以访问 Clarifai API,并将其设置为环境变量 (CLARIFAI_PAT)。

模型

Clarifai 提供了数千个 AI 模型,适用于多种不同的用例。您可以在 这里探索 以找到最适合您用例的模型。这些模型包括其他提供商创建的模型,如 OpenAI、Anthropic、Cohere、AI21 等,以及来自开源的最先进模型,如 Falcon、InstructorXL 等,以便您将最佳 AI 技术融入您的产品。您会发现这些模型按创建者的 user_id 组织,并分为我们称之为应用程序的项目,标识为 app_id。找到最适合您用例的模型后,您需要记录这些 ID,除了 model_id 之外,还可以选择记录 version_id。

还请注意,由于图像、视频、文本和音频理解的模型众多,您可以构建一些有趣的 AI 代理,利用各种 AI 模型作为专家来理解这些数据类型。

LLMs

要在Clarifai平台中找到LLMs的选择,可以在这里选择文本到文本模型类型。

from langchain_community.llms import Clarifai
llm = Clarifai(pat=CLARIFAI_PAT, user_id=USER_ID, app_id=APP_ID, model_id=MODEL_ID)

有关更多详细信息,Clarifai LLM包装器的文档提供了详细指南

文本嵌入模型

要在 Clarifai 平台上查找文本嵌入模型的选择,可以在 这里 选择文本嵌入模型类型。

在 LangChain 中有一个 Clarifai 嵌入模型,您可以通过以下方式访问:

from langchain_community.embeddings import ClarifaiEmbeddings
embeddings = ClarifaiEmbeddings(pat=CLARIFAI_PAT, user_id=USER_ID, app_id=APP_ID, model_id=MODEL_ID)

有关更多详细信息,Clarifai Embeddings 包装器的文档提供了一个 详细指南

向量存储

Clarifai 的向量数据库于 2016 年推出,并已优化以支持实时搜索查询。通过 Clarifai 平台中的工作流程,您的数据会通过嵌入模型自动进行索引,并可选择其他模型来将该信息索引到数据库中以供搜索。您不仅可以通过向量查询数据库,还可以通过元数据匹配、其他 AI 预测概念进行过滤,甚至可以进行地理坐标搜索。只需创建一个应用程序,选择适合您数据类型的基本工作流程,然后通过 API(如 此处所述)或在 clarifai.com 的用户界面上传数据。

您还可以直接从 LangChain 添加数据,自动索引将为您进行。您会注意到,这与其他向量存储有些不同,后者需要在构造函数中提供嵌入模型,并让 LangChain 协调从文本获取嵌入并将其写入索引。使用 Clarifai 的分布式云在后台进行所有索引,不仅更方便,而且更具可扩展性。

from langchain_community.vectorstores import Clarifai
clarifai_vector_db = Clarifai.from_texts(user_id=USER_ID, app_id=APP_ID, texts=texts, pat=CLARIFAI_PAT, number_of_docs=NUMBER_OF_DOCS, metadatas = metadatas)

有关更多详细信息,Clarifai 向量存储的文档提供了 详细指南


此页面是否有帮助?


您还可以留下详细的反馈 在 GitHub 上