跳至主要内容

如何减少检索延迟

先决条件

本指南假设您熟悉以下概念

减少检索延迟的一种方法是使用称为“自适应检索”的技术。该 MatryoshkaRetriever 使用 Matryoshka 表示学习 (MRL) 技术分两步为给定查询检索文档

  • 第一步:使用 MRL 嵌入的低维子向量进行初始快速搜索,但精度较低。

  • 第二步:使用完整的、高维嵌入重新排名第一步的最佳结果,以获得更高的精度。

Matryoshka Retriever

它基于此 Supabase 博客文章 “Matryoshka 嵌入:使用自适应检索实现更快的 OpenAI 向量搜索”

设置

npm install @langchain/openai @langchain/community @langchain/core

要按照以下示例进行操作,您需要一个 OpenAI API 密钥

export OPENAI_API_KEY=your-api-key

我们还将使用 chroma 作为我们的向量存储。请按照 此处 的说明进行设置。

import { MatryoshkaRetriever } from "langchain/retrievers/matryoshka_retriever";
import { Chroma } from "@langchain/community/vectorstores/chroma";
import { OpenAIEmbeddings } from "@langchain/openai";
import { Document } from "@langchain/core/documents";
import { faker } from "@faker-js/faker";

const smallEmbeddings = new OpenAIEmbeddings({
model: "text-embedding-3-small",
dimensions: 512, // Min number for small
});

const largeEmbeddings = new OpenAIEmbeddings({
model: "text-embedding-3-large",
dimensions: 3072, // Max number for large
});

const vectorStore = new Chroma(smallEmbeddings, {
numDimensions: 512,
});

const retriever = new MatryoshkaRetriever({
vectorStore,
largeEmbeddingModel: largeEmbeddings,
largeK: 5,
});

const irrelevantDocs = Array.from({ length: 250 }).map(
() =>
new Document({
pageContent: faker.lorem.word(7), // Similar length to the relevant docs
})
);
const relevantDocs = [
new Document({
pageContent: "LangChain is an open source github repo",
}),
new Document({
pageContent: "There are JS and PY versions of the LangChain github repos",
}),
new Document({
pageContent: "LangGraph is a new open source library by the LangChain team",
}),
new Document({
pageContent: "LangChain announced GA of LangSmith last week!",
}),
new Document({
pageContent: "I heart LangChain",
}),
];
const allDocs = [...irrelevantDocs, ...relevantDocs];

/**
* IMPORTANT:
* The `addDocuments` method on `MatryoshkaRetriever` will
* generate the small AND large embeddings for all documents.
*/
await retriever.addDocuments(allDocs);

const query = "What is LangChain?";
const results = await retriever.invoke(query);
console.log(results.map(({ pageContent }) => pageContent).join("\n"));

/**
I heart LangChain
LangGraph is a new open source library by the LangChain team
LangChain is an open source github repo
LangChain announced GA of LangSmith last week!
There are JS and PY versions of the LangChain github repos
*/

API 参考

注意

由于某些向量存储的限制,大型嵌入元数据字段在存储之前被字符串化 (JSON.stringify)。这意味着在从向量存储检索时,需要解析元数据字段 (JSON.parse)。

下一步

您现在已经了解了一种可以帮助加快检索查询速度的技术。

接下来,请查看 有关 RAG 的更广泛教程,或查看本部分了解如何 在任何数据源上创建自己的自定义检索器


此页面对您有帮助吗?


您也可以在 GitHub 上留下详细的反馈 GitHub.