GitBook
此示例介绍如何使用 Cheerio 从任何 GitBook 加载数据。将为每个页面创建一个文档。
设置
- npm
- Yarn
- pnpm
npm install cheerio
yarn add cheerio
pnpm add cheerio
从单个 GitBook 页面加载
import { GitbookLoader } from "@langchain/community/document_loaders/web/gitbook";
const loader = new GitbookLoader(
"https://docs.gitbook.com/product-tour/navigation"
);
const docs = await loader.load();
从给定 GitBook 中的所有路径加载
要使此功能正常工作,GitbookLoader 需要使用根路径 (https://docs.gitbook.com,在本例中) 初始化,并将 shouldLoadAllPaths
设置为 true
。
import { GitbookLoader } from "@langchain/community/document_loaders/web/gitbook";
const loader = new GitbookLoader("https://docs.gitbook.com", {
shouldLoadAllPaths: true,
});
const docs = await loader.load();