Airbyte 问答

本笔记展示了如何在结构化数据上进行问答，这里使用 AirbyteStripeLoader。

向量存储通常在回答需要计算、分组和过滤结构化数据的问题时会遇到困难，因此高层次的想法是使用 pandas 数据框来帮助处理这些类型的问题。

%pip install -qU langchain-community

使用 Airbyte 从 Stripe 加载数据。使用 record_handler 参数从数据加载器返回 JSON。

import os

import pandas as pd
from langchain.agents import AgentType
from langchain_community.document_loaders.airbyte import AirbyteStripeLoader
from langchain_experimental.agents import create_pandas_dataframe_agent
from langchain_openai import ChatOpenAI

stream_name = "customers"
config = {
    "client_secret": os.getenv("STRIPE_CLIENT_SECRET"),
    "account_id": os.getenv("STRIPE_ACCOUNT_D"),
    "start_date": "2023-01-20T00:00:00Z",
}


def handle_record(record: dict, _id: str):
    return record.data


loader = AirbyteStripeLoader(
    config=config,
    record_handler=handle_record,
    stream_name=stream_name,
)
data = loader.load()

将数据传递给 pandas 数据框。

df = pd.DataFrame(data)

将数据框 df 传递给 create_pandas_dataframe_agent 并调用。

agent = create_pandas_dataframe_agent(
    ChatOpenAI(temperature=0, model="gpt-4"),
    df,
    verbose=True,
    agent_type=AgentType.OPENAI_FUNCTIONS,
)

运行代理。

output = agent.run("How many rows are there?")

Airbyte 问答

此页面是否有帮助？

您还可以留下详细的反馈在 GitHub 上

Airbyte 问答

此页面是否有帮助？

您还可以留下详细的反馈 在 GitHub 上

您还可以留下详细的反馈在 GitHub 上