跳至主要内容

AssemblyAI 音频转录

这涵盖了如何使用 AssemblyAI API 从文件加载音频(和视频)转录作为文档对象。

使用

首先,您需要安装官方 AssemblyAI 包

npm install @langchain/community @langchain/core assemblyai

要使用加载器,您需要一个 AssemblyAI 帐户从仪表板获取您的 AssemblyAI API 密钥

然后,将 API 密钥配置为 ASSEMBLYAI_API_KEY 环境变量或 apiKey 选项参数。

import {
AudioTranscriptLoader,
// AudioTranscriptParagraphsLoader,
// AudioTranscriptSentencesLoader
} from "@langchain/community/document_loaders/web/assemblyai";

// You can also use a local file path and the loader will upload it to AssemblyAI for you.
const audioUrl = "https://storage.googleapis.com/aai-docs-samples/espn.m4a";

// Use `AudioTranscriptParagraphsLoader` or `AudioTranscriptSentencesLoader` for splitting the transcript into paragraphs or sentences
const loader = new AudioTranscriptLoader(
{
audio: audioUrl,
// any other parameters as documented here: https://www.assemblyai.com/docs/api-reference/transcripts/submit
},
{
apiKey: "<ASSEMBLYAI_API_KEY>", // or set the `ASSEMBLYAI_API_KEY` env variable
}
);
const docs = await loader.load();
console.dir(docs, { depth: Infinity });

API 参考

信息

  • 您可以使用 AudioTranscriptParagraphsLoaderAudioTranscriptSentencesLoader 将转录拆分为段落或句子。
  • audio 参数可以是 URL、本地文件路径、缓冲区或流。
  • audio 也可以是视频文件。请参阅 常见问题解答文档中支持的文件类型列表
  • 如果您不传入 apiKey 选项,加载器将使用 ASSEMBLYAI_API_KEY 环境变量。
  • 除了 audio 之外,您还可以添加更多属性。在 AssemblyAI API 文档 中查找请求参数的完整列表。

您还可以使用 AudioSubtitleLoader 获取 srtvtt 字幕作为文档。

import { AudioSubtitleLoader } from "@langchain/community/document_loaders/web/assemblyai";

// You can also use a local file path and the loader will upload it to AssemblyAI for you.
const audioUrl = "https://storage.googleapis.com/aai-docs-samples/espn.m4a";

const loader = new AudioSubtitleLoader(
{
audio: audioUrl,
// any other parameters as documented here: https://www.assemblyai.com/docs/api-reference/transcripts/submit
},
"srt", // srt or vtt
{
apiKey: "<ASSEMBLYAI_API_KEY>", // or set the `ASSEMBLYAI_API_KEY` env variable
}
);

const docs = await loader.load();
console.dir(docs, { depth: Infinity });

API 参考


此页面是否有帮助?


您也可以留下详细的反馈 在 GitHub 上.