跳至主要内容

DirectoryLoader

兼容性

仅在 Node.js 上可用。

此笔记本提供了有关入门 DirectoryLoader 文档加载器 的快速概述。有关所有 DirectoryLoader 功能和配置的详细文档,请前往 API 参考

此示例介绍了如何从包含多个文件的文件夹中加载数据。第二个参数是文件扩展名到加载器工厂的映射。每个文件都将传递到匹配的加载器,并且生成的文档将合并在一起。

示例文件夹

src/document_loaders/example_data/example/
├── example.json
├── example.jsonl
├── example.txt
└── example.csv

概述

集成详细信息

兼容性本地PY 支持
DirectoryLoaderlangchain仅限节点

设置

要访问 DirectoryLoader 文档加载器,您需要安装 langchain 包。

安装

LangChain DirectoryLoader 集成位于 langchain 包中

yarn add langchain

实例化

现在我们可以实例化模型对象并加载文档

import { DirectoryLoader } from "langchain/document_loaders/fs/directory";
import {
JSONLoader,
JSONLinesLoader,
} from "langchain/document_loaders/fs/json";
import { TextLoader } from "langchain/document_loaders/fs/text";
import { CSVLoader } from "@langchain/community/document_loaders/fs/csv";

const loader = new DirectoryLoader(
"../../../../../../examples/src/document_loaders/example_data",
{
".json": (path) => new JSONLoader(path, "/texts"),
".jsonl": (path) => new JSONLinesLoader(path, "/html"),
".txt": (path) => new TextLoader(path),
".csv": (path) => new CSVLoader(path, "text"),
}
);

加载

const docs = await loader.load();
// disable console.warn calls
console.warn = () => {};
docs[0];
Document {
pageContent: 'Foo\nBar\nBaz\n\n',
metadata: {
source: '/Users/bracesproul/code/lang-chain-ai/langchainjs/examples/src/document_loaders/example_data/example.txt'
},
id: undefined
}
console.log(docs[0].metadata);
{
source: '/Users/bracesproul/code/lang-chain-ai/langchainjs/examples/src/document_loaders/example_data/example.txt'
}

API 参考

有关所有 DirectoryLoader 功能和配置的详细文档,请前往 API 参考:https://api.js.langchain.com/classes/langchain.document_loaders_fs_directory.DirectoryLoader.html


此页面是否有帮助?


您也可以在 GitHub 上留下详细的反馈 GitHub.