如何创建时间加权检索器

先决条件

本指南假设您熟悉以下概念

本指南涵盖了 TimeWeightedVectorStoreRetriever，它结合了语义相似性和时间衰减。

对其进行评分的算法是

semantic_similarity + (1.0 - decay_rate) ^ hours_passed

值得注意的是，hours_passed 指的是自检索器中的对象上次被访问以来经过的小时数，而不是自其创建以来。这意味着经常访问的对象保持“新鲜”。

let score = (1.0 - this.decayRate) ** hoursPassed + vectorRelevance;

this.decayRate 是一个可配置的十进制数字，介于 0 和 1 之间。较低的数字意味着文档将被“记住”更长时间，而较高的数字则强烈加权最近访问的文档。

请注意，将衰减率设置为正好 0 或 1 会使 hoursPassed 无关紧要，并使此检索器等同于标准向量查找。

重要的是要注意，由于需要元数据，所有文档都必须使用检索器上的 addDocuments 方法添加到后备向量存储中，而不是向量存储本身。

提示

请参阅此部分，了解有关安装集成包的通用说明。

npm
Yarn
pnpm

npm install @langchain/openai @langchain/core

yarn add @langchain/openai @langchain/core

pnpm add @langchain/openai @langchain/core

import { TimeWeightedVectorStoreRetriever } from "langchain/retrievers/time_weighted";
import { MemoryVectorStore } from "langchain/vectorstores/memory";
import { OpenAIEmbeddings } from "@langchain/openai";

const vectorStore = new MemoryVectorStore(new OpenAIEmbeddings());

const retriever = new TimeWeightedVectorStoreRetriever({
  vectorStore,
  memoryStream: [],
  searchKwargs: 2,
});

const documents = [
  "My name is John.",
  "My name is Bob.",
  "My favourite food is pizza.",
  "My favourite food is pasta.",
  "My favourite food is sushi.",
].map((pageContent) => ({ pageContent, metadata: {} }));

// All documents must be added using this method on the retriever (not the vector store!)
// so that the correct access history metadata is populated
await retriever.addDocuments(documents);

const results1 = await retriever.invoke("What is my favourite food?");

console.log(results1);

/*
[
  Document { pageContent: 'My favourite food is pasta.', metadata: {} }
]
 */

const results2 = await retriever.invoke("What is my favourite food?");

console.log(results2);

/*
[
  Document { pageContent: 'My favourite food is pasta.', metadata: {} }
]
 */

API 参考

TimeWeightedVectorStoreRetriever 来自 langchain/retrievers/time_weighted
MemoryVectorStore 来自 langchain/vectorstores/memory
OpenAIEmbeddings 来自 @langchain/openai

下一步

您现在已经学习了如何在执行检索时使用时间作为因素。

接下来，查看关于 RAG 的更广泛的教程，或此部分以了解如何在任何数据源上创建您自己的自定义检索器。

如何创建时间加权检索器

API 参考

下一步

此页面是否对您有所帮助？

您也可以留下详细的反馈在 GitHub 上.

如何创建时间加权检索器

API 参考

下一步​

此页面是否对您有所帮助？

您也可以留下详细的反馈 在 GitHub 上.

下一步

您也可以留下详细的反馈在 GitHub 上.