AssemblyAI 音频转录
这涵盖了如何使用 AssemblyAI API 从文件中加载音频(和视频)转录作为文档对象。
用法
首先,您需要安装官方的 AssemblyAI 包
- npm
- Yarn
- pnpm
npm install assemblyai
yarn add assemblyai
pnpm add assemblyai
要使用加载器,您需要一个 AssemblyAI 帐户 并在 仪表板中获取您的 AssemblyAI API 密钥。
然后,将 API 密钥配置为 ASSEMBLYAI_API_KEY
环境变量或 apiKey
选项参数。
import {
AudioTranscriptLoader,
// AudioTranscriptParagraphsLoader,
// AudioTranscriptSentencesLoader
} from "@langchain/community/document_loaders/web/assemblyai";
// You can also use a local file path and the loader will upload it to AssemblyAI for you.
const audioUrl = "https://storage.googleapis.com/aai-docs-samples/espn.m4a";
// Use `AudioTranscriptParagraphsLoader` or `AudioTranscriptSentencesLoader` for splitting the transcript into paragraphs or sentences
const loader = new AudioTranscriptLoader(
{
audio: audioUrl,
// any other parameters as documented here: https://www.assemblyai.com/docs/api-reference/transcripts/submit
},
{
apiKey: "<ASSEMBLYAI_API_KEY>", // or set the `ASSEMBLYAI_API_KEY` env variable
}
);
const docs = await loader.load();
console.dir(docs, { depth: Infinity });
API 参考
- AudioTranscriptLoader 来自
@langchain/community/document_loaders/web/assemblyai
信息
- 您可以使用
AudioTranscriptParagraphsLoader
或AudioTranscriptSentencesLoader
将转录拆分为段落或句子。audio
参数可以是 URL、本地文件路径、缓冲区或流。audio
也可以是视频文件。请参阅 常见问题解答文档中支持的文件类型列表。- 如果您没有传入
apiKey
选项,加载器将使用ASSEMBLYAI_API_KEY
环境变量。- 除了
audio
之外,您还可以添加更多属性。在 AssemblyAI API 文档 中查找请求参数的完整列表。
您还可以使用 AudioSubtitleLoader
获取 srt
或 vtt
字幕作为文档。
import { AudioSubtitleLoader } from "@langchain/community/document_loaders/web/assemblyai";
// You can also use a local file path and the loader will upload it to AssemblyAI for you.
const audioUrl = "https://storage.googleapis.com/aai-docs-samples/espn.m4a";
const loader = new AudioSubtitleLoader(
{
audio: audioUrl,
// any other parameters as documented here: https://www.assemblyai.com/docs/api-reference/transcripts/submit
},
"srt", // srt or vtt
{
apiKey: "<ASSEMBLYAI_API_KEY>", // or set the `ASSEMBLYAI_API_KEY` env variable
}
);
const docs = await loader.load();
console.dir(docs, { depth: Infinity });
API 参考
- AudioSubtitleLoader 来自
@langchain/community/document_loaders/web/assemblyai