OpenAI上线Flex处理模式：API费用减半，但牺牲响应速度及稳定性

0次浏览发布时间：2025-04-18 09:13:00

IT之家 4 月 18 日消息，据外媒 TechCrunch 今日报道，为在与谷歌等生成式 AI 竞争对手的较量中进一步加大投入，OpenAI 宣布推出“Flex 处理模式”新的 API 服务 —— 用户以接受响应速度变慢和“资源偶尔无法分配”为代价，换取更优惠的模型使用价格。

OpenAI 表示，Flex 处理目前已对新近发布的 o3 和 o4-mini 推理模型开放测试，主要面向模型评估、数据扩充、异步处理等优先级较低的“非生产”任务。

采用 Flex 处理，API 费用将直接减半。以 o3 为例，Flex 模式下的费用为每百万输入 tokens 收取 5 美元（IT之家注：现汇率约合 36.5 元人民币，相当于约合 75 万字），每百万输出 tokens 收取 20 美元（现汇率约合 146 元人民币）。

作为参考，标准价格分别为 10 美元和 40 美元。对于 o4-mini，Flex 模式的费用则从每百万输入 tokens 收取 1.10 美元、每百万输出 tokens 收取 4.40 美元，降至每百万输入 tokens 收取 0.55 美元（现汇率约合 4 元人民币）和每百万输出 tokens 收取 2.20 美元（现汇率约合 16.1 元人民币）。

OpenAI 在向客户发送的通知邮件中还表示，按照公司用户的消费层级划分，处于第 1 至第 3 层的开发者必须完成新上线的身份验证流程，方可获取 o3 的访问权限。此外，OpenAI 指出，o3 及其他模型的推理摘要功能和流式 API 服务同样需要完成身份验证后才能启用。

OpenAI 此前强调，身份验证机制的目的是防止用户违反公司制定的使用政策。

本文分类：实时讯息
本文标签：现汇美元约合模型费用人民币之家身份验证
浏览次数：0 次浏览
发布日期：2025-04-18 09:13:00
本文链接：https://www.rqwz.net/news/kj7qER17ml.html

当前位置

OpenAI上线Flex处理模式：API费用减半，但牺牲响应速度及稳定性

相关文章

热门文章

最新文章