GPT-5 在 Responses API 中复用推理上下文

2025-08-15 10:08 更新

如果你使用 GPT-5 构建代理流,我们强烈建议切换到 Responses API,以解锁更流畅的代理流程、更低的成本以及更高效的 token 利用率。

在内部评测中,仅通过切换到 Responses API 并把 previous_response_id 传回后续请求,即可让模型复用先前的推理痕迹,显著降低 CoT token 消耗,并避免在每次工具调用后重新构建计划。由此带来的性能提升在统计上十分显著——例如在 Tau-Bench Retail 基准上,分数从 73.9% 提升到 78.2%。该功能对所有 Responses API 用户(含 ZDR 组织)均已开放。

以上内容是否对您有帮助:
在线笔记
App下载
App下载

扫描二维码

下载编程狮App

公众号
微信公众号

编程狮公众号