模型定位
GPT-5.4 mini 是 OpenAI 当前 GPT-5.4 系列里的低成本版本,官方强调代码、计算机使用和子任务代理能力。
适合场景
- 高频代码辅助
- 子任务拆解和工具调用
- 成本敏感的批量分析、改写、摘要
价格与上下文
- 输入价格:$0.75 / MTok
- 缓存输入:$0.075 / MTok
- 输出价格:$4.50 / MTok
- 上下文窗口:400,000 tokens
选择建议
如果任务量大、结果允许再复核,mini 通常比旗舰模型更适合做默认生产版本。
GPT-5.4 mini 是 OpenAI 当前 GPT-5.4 系列里的低成本版本,官方强调代码、计算机使用和子任务代理能力。
如果任务量大、结果允许再复核,mini 通常比旗舰模型更适合做默认生产版本。
根据 OpenAI 发布 GPT-5.4 mini 和 nano 时披露的 benchmark 数据重绘,主要比较 GPT-5.4、GPT-5.4 mini、GPT-5.4 nano 和 GPT-5 mini。
真实代码修复
终端任务执行
多工具任务
高难科学问答
看屏幕并操作界面
图文理解
| 评测项 | 能力方向 | GPT-5.4 | GPT-5.4 mini | GPT-5.4 nano | GPT-5 mini |
|---|---|---|---|---|---|
| SWE-bench Pro (Public) | 真实代码修复 | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 终端任务执行 | 75.1% | 60.0% | 46.3% | 38.2% |
| Toolathlon | 多工具任务 | 54.6% | 42.9% | 35.5% | 26.9% |
| GPQA Diamond | 高难科学问答 | 93.0% | 88.0% | 82.8% | 81.6% |
| OSWorld-Verified | 看屏幕并操作界面 | 75.0% | 72.1% | 39.0% | 42.0% |
| MMMUPro | 图文理解 | 81.2% | 76.6% | 66.1% | 67.5% |
评测分数适合用来快速了解模型在代码、推理、工具调用等方向的表现,实际选型还需要结合任务类型、价格和响应速度一起看。