OpenAI取消GPT-4 Turbo的每日限制!

seekdeep2年前AI资讯922

OpenAI在社交平台宣布,取消了GPT-4Turbo的所有每日限制,并将速率限制提升1倍。现在,每分钟可处理高达150万TPM的数据。

OpenAI这一周的连续王炸组合拳,从ChatGPT增加 “记忆存储”,到视频模型Sora再到GPT-4Turbo全面取消每日限制,打的谷歌、Meta有点晕头转向抢尽风头。

对于用户来说,只希望巨头之间撕的更凶一些,这样咱们看到的、得到的、用到的也就更多。

2023年初,OpenAI的估值只有200多亿美元,年底暴涨至800亿美元,很多人认为这也太虚高了。看了前天推出的Sora后,多数人沉默了感觉OpenAI的估值太保守了。

为什么OpenAI要进行速率限制

OpenAI表示,速率限制是其API对开发者或产品用户,在指定时间段内访问OpenAI服务器的次数增加的一种服务限制。这样做主要有以下几个原因。

1)有助于防止 API 被滥用或误用。例如,黑客可能会向 API 提出大量请求,致使服务器超载或宕机。通过设置速率限制,可以防止此类事情发生。

2)速率限制有助于确保,每个人都能公平地访问 API。如果一个人或一个组织频繁提出过多的服务请求,可能会导致其他所有人都无法使用 API。

通过限制单个用户的请求数量,OpenAI 可以确保大多数人都有机会使用 API,而不会出现速度变慢的情况。

3)速率限制可有效帮助 OpenAI 管理其基础设施的总负载。如果对 API 的请求急剧增加,可能会给服务器造成负担,出现服务中断等严重问题。

去年,OpenAI刚发布自定义GPT时,就发生过一次类似事情。

OpenAI的速率限制,有哪些种类

目前,OpenAI一共使用了5种速率限制:RPM(每分钟请求数)、RPD(每天请求数)、TPM(每分钟tokens数量)、TPD(每天tokens数量)和IPM(每分钟图像数量)。

任何一种请求都可能触发速率限制,例如,用户向 ChatCompletions 端点发送20个请求,其中只有100个tokens,这样就会触发速率限制(假如 RPM 限制是20);即使你在这20个请求中没有发送150k 的tokens。

简单来说,这五种限制,你只要满足一种就会触发。

需要注意的是,速率限制是对组织级别实施的,对个体用户没啥影响。速率限制因所使用的模式而异,组织每月在 API 上的总支出也有"使用限制"。

如何查看自己的限制等级

用户可以在账户设置的 "限制 "功能,查看组织的速率和使用限制。

随着你对 OpenAI 的API 的使用以及组织在AP上的费用支出的增加,会自动升级你的使用级别。目前,一共有5个等级。

如何避免速率限制

OpenAI的Cookbook发布了一个攻略,帮助大家避免出现速率限制的错误,以及一个用于在批处理 API 请求时,保持速率限制的示例Python 脚本。

地址:https://cookbook.openai.com/examples/how_to_handle_rate_limits

OpenAI表示,最简单的避免速率限制方法,就是使用“指数退避重试”。

主要通过动态调整重试等待时间,这种机制可有效减少服务器的负载,提高请求成功的可能性,并对系统资源进行高效管理。

指数退避重试能在连续的失败尝试之间引入逐渐增加的延迟,以减少对服务器或网络资源的压力,增加后续尝试成功的可能性。

但使用指数退避重试时,也需要注意几个事项:1)重试次数和最大延迟时间的限制,以防止无休止的重试;2)合理设置最小延迟和倍数,以适应具体应用场景的需求;

3)记录和监控重试事件,以便于故障排查和性能优化;4)考虑请求的幂等性,确保重试不会引起数据错误或不一致。


相关文章

GPT-5全面超越GPT-4,核聚变成最大王牌

OpenAI再一次敲响了AGI时刻。AGI不久后到来,OpenAI已做好准备当地时间1月18日,在瑞士达沃斯举办的“2024年度世界经济论坛”上,OpenAI首席执行官山姆·奥特曼再一次语出惊人,成为...

千亿市值归零,ChatGPT 干掉了一家上市公司!

近期,一家美国上市公司好像几乎要被 ChatGPT 搞垮了。自 ChatGPT 发布以来,美国教育科技公司 Chegg 的股价已经暴跌 99%,市值蒸发掉 145 亿美元(约 1050.7 亿元人民币...

日耗电量高达50万度 ,GPT成“吃电狂魔”, 马斯克“电荒”预言成真?

最近一段时间,公众开始注意到,当前蓬勃发展的生成式AI技术需要耗费大量的电力。据《纽约客》当时时间9日报道,荷兰国家银行数据专家Alex de Vries估计,OpenAI旗下聊天机器人ChatGPT...

上海AI Lab开始给大模型重新出题了,GPT-4o数学能力跑分直掉50%!

新模型在 MATH 上(以数学竞赛为主)动辄跑分 80% 甚至 90% 以上,却一用就废。这合理吗??为了真实检验模型数学推理能力,上海人工智能实验室司南 OpenCompass 团队放大招了。推出新...

2B参数越级跑赢GPT-3.5-Turbom,谷歌开源最强端侧小模型!

谷歌也来卷「小」模型了,一出手就是王炸,胜过了比自己参数多得多的GPT-3.5、Mixtral竞品模型。今年 6 月底,谷歌开源了 9B、27B 版 Gemma 2 模型系列,并且自亮相以来,27B...

OpenAI员工:没什么科学突破了,接下来只需要工程.GPT-5被曝不及预期!

OpenAI下一代旗舰模型被曝提升不如预期。具体指代号“猎户座”(Orion)的模型相对GPT-4的提升幅度,小于GPT-4相对GPT-3,已进入收益递减阶段。或许这也是奥特曼曾说,可能不会把新模型命...