S3 文件
兼容性
仅在 Node.js 上可用。
这涵盖了如何从 s3 文件对象加载文档对象。
设置
要运行此索引,您需要已设置 Unstructured,并且已准备好以可用的 URL 终结点使用。它也可以配置为在本地运行。
有关如何执行此操作的信息,请参阅 此处的文档。
您还需要安装官方 AWS SDK
- npm
- Yarn
- pnpm
npm install @aws-sdk/client-s3
yarn add @aws-sdk/client-s3
pnpm add @aws-sdk/client-s3
用法
配置好 Unstructured 后,可以使用 S3 加载器加载文件,然后将其转换为 Document。
您可以选择提供 s3Config 参数来指定您的存储桶区域、访问密钥和秘密访问密钥。如果未提供这些内容,您需要将其置于环境中(例如,通过运行 aws configure
)。
import { S3Loader } from "@langchain/community/document_loaders/web/s3";
const loader = new S3Loader({
bucket: "my-document-bucket-123",
key: "AccountingOverview.pdf",
s3Config: {
region: "us-east-1",
credentials: {
accessKeyId: "AKIAIOSFODNN7EXAMPLE",
secretAccessKey: "wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY",
},
},
unstructuredAPIURL: "http://localhost:8000/general/v0/general",
unstructuredAPIKey: "", // this will be soon required
});
const docs = await loader.load();
console.log(docs);
API 参考
- S3Loader 来自
@langchain/community/document_loaders/web/s3