Skip to main content

Eleven Labs 文本转语音

本笔记本展示了如何与 ElevenLabs API 进行交互以实现文本转语音功能。

首先,您需要设置一个 ElevenLabs 帐户。您可以按照 这里 的说明进行操作。

%pip install --upgrade --quiet  elevenlabs langchain-community
import os

os.environ["ELEVEN_API_KEY"] = ""

用法

from langchain_community.tools import ElevenLabsText2SpeechTool

text_to_speak = "Hello world! I am the real slim shady"

tts = ElevenLabsText2SpeechTool()
tts.name
'eleven_labs_text2speech'

我们可以生成音频,将其保存到临时文件中,然后播放它。

speech_file = tts.run(text_to_speak)
tts.play(speech_file)

或者直接流式传输音频。

tts.stream_speech(text_to_speak)

在代理中的使用

from langchain.agents import AgentType, initialize_agent, load_tools
from langchain_openai import OpenAI
llm = OpenAI(temperature=0)
tools = load_tools(["eleven_labs_text2speech"])
agent = initialize_agent(
tools=tools,
llm=llm,
agent=AgentType.STRUCTURED_CHAT_ZERO_SHOT_REACT_DESCRIPTION,
verbose=True,
)
audio_file = agent.run("给我讲个笑话,并为我朗读出来。")


> 进入新的 AgentExecutor 链...
动作:

{ "action": "eleven_labs_text2speech", "action_input": { "query": "为什么鸡要过游乐场?为了到达另一边的滑梯!" } }



观察: /tmp/tmpsfg783f1.wav
思考: 我已经准备好音频文件可以发送给人类
动作:

{ "action": "最终答案", "action_input": "/tmp/tmpsfg783f1.wav" }




> 完成链。
tts.play(audio_file)

相关


此页面是否有帮助?


您还可以留下详细的反馈 在 GitHub 上