跳到主要内容

MODEL_RATE_LIMIT

您已达到模型提供商在给定时间段内允许的最大请求数,并且暂时被阻止。 通常,此错误是暂时的,您的限制将在一定时间后重置。

问题排查

以下方法可能有助于解决此错误

  • 联系您的模型提供商,要求提高速率限制。
  • 如果您的许多传入请求是相同的,请使用模型响应缓存
  • 如果您的应用程序允许,请将请求分散到不同的提供商。
  • 在初始化模型时,设置更高的最大重试次数。 LangChain 将对以这种方式失败的请求使用指数退避策略,因此重试可能会在您的限制重置后发生。

此页面是否对您有帮助?


您也可以留下详细的反馈 在 GitHub 上.

© . This site is unofficial and not affiliated with LangChain, Inc.
这些文档随着 LangChain v1.0 在 2025 年 10 月的发布而弃用,并且不再维护。 请访问 v1.0 文档