跳到主要内容

MODEL_RATE_LIMIT

您已达到模型提供商在给定时间段内允许的最大请求数,并且暂时被阻止。 通常,此错误是暂时的,您的限制将在一定时间后重置。

问题排查

以下方法可能有助于解决此错误

  • 联系您的模型提供商,要求提高速率限制。
  • 如果您的许多传入请求是相同的,请使用模型响应缓存
  • 如果您的应用程序允许,请将请求分散到不同的提供商。
  • 在初始化模型时,设置更高的最大重试次数。 LangChain 将对以这种方式失败的请求使用指数退避策略,因此重试可能会在您的限制重置后发生。

此页面是否对您有帮助?


您也可以留下详细的反馈 在 GitHub 上.