跳至主要内容

时间加权检索器

时间加权检索器是一种检索器,它除了考虑相似性之外,还考虑了最近度。评分算法是

let score = (1.0 - this.decayRate) ** hoursPassed + vectorRelevance;

值得注意的是,上面的 hoursPassed 指的是检索器中对象上次访问的时间,而不是它被创建的时间。这意味着频繁访问的对象会保持“新鲜”状态,并获得更高的评分。

this.decayRate 是一个可配置的介于 0 和 1 之间的十进制数。较小的数字意味着文档将被“记住”更长时间,而较大的数字则会强烈地加权最近访问的文档。

请注意,将衰减率设置为恰好为 0 或 1 会使 hoursPassed 无关紧要,并将该检索器等效于标准向量查找。

用法

此示例展示了如何使用向量存储初始化 TimeWeightedVectorStoreRetriever。需要注意的是,由于需要元数据,所有文档必须使用**检索器**上的 addDocuments 方法添加到支持的向量存储中,而不是向量存储本身。

提示

有关安装集成包的常规说明,请参阅 本节

npm install @langchain/openai @langchain/core
import { TimeWeightedVectorStoreRetriever } from "langchain/retrievers/time_weighted";
import { MemoryVectorStore } from "langchain/vectorstores/memory";
import { OpenAIEmbeddings } from "@langchain/openai";

const vectorStore = new MemoryVectorStore(new OpenAIEmbeddings());

const retriever = new TimeWeightedVectorStoreRetriever({
vectorStore,
memoryStream: [],
searchKwargs: 2,
});

const documents = [
"My name is John.",
"My name is Bob.",
"My favourite food is pizza.",
"My favourite food is pasta.",
"My favourite food is sushi.",
].map((pageContent) => ({ pageContent, metadata: {} }));

// All documents must be added using this method on the retriever (not the vector store!)
// so that the correct access history metadata is populated
await retriever.addDocuments(documents);

const results1 = await retriever.invoke("What is my favourite food?");

console.log(results1);

/*
[
Document { pageContent: 'My favourite food is pasta.', metadata: {} }
]
*/

const results2 = await retriever.invoke("What is my favourite food?");

console.log(results2);

/*
[
Document { pageContent: 'My favourite food is pasta.', metadata: {} }
]
*/

API 参考


此页面是否有帮助?


您也可以在 GitHub 上留下详细的反馈 在 GitHub 上.