Response
支持Response请求方式的模型
图标说明
输入: 文本 · 图像
Azure OpenAI
| 厂商 | 接口模型ID | 模型能力 | endpoint | 价格(每百万 Tokens) | 上线时间 | 预计下线时间 | 负载能力 | 支持访问地区 | 备注 |
|---|---|---|---|---|---|---|---|---|---|
| Azure | turing/gpt-5.5 | max_input_tokens: 922,000max_output_tokens: 128,000输入: 输出: 工具: 支持 思考: 支持 | v1/responsesv1/chat/completions | 输入: $5输出: $30缓存输入: $0.5 | - | - | Azure全球 | 中国区 欧洲区 北美区 | 新一代旗舰模型,思考功能推荐使用 Response API |
| Azure | turing/gpt-5.4 | max_input_tokens: 922,000max_output_tokens: 128,000输入: 输出: 工具: 支持 思考: 支持 | v1/responsesv1/chat/completions | 输入: $2.5输出: $15缓存输入: $0.25 | - | - | Azure全球 | 中国区 欧洲区 北美区 | 上一代升级版本,思考功能推荐使用 Response API |
| Azure | turing/gpt-5.4-mini | max_input_tokens: 400,000max_output_tokens: 128,000输入: 输出: 工具: 支持 思考: 支持 | v1/responsesv1/chat/completions | 输入: $0.75输出: $4.5缓存输入: $0.075 | - | - | Azure全球 | 中国区 欧洲区 北美区 | 高性价比mini模型,思考功能推荐使用 Response API |
| Azure | turing/gpt-5.4-nano | max_input_tokens: 400,000max_output_tokens: 128,000输入: 输出: 工具: 支持 思考: 支持 | v1/responsesv1/chat/completions | 输入: $0.2输出: $1.25缓存输入: $0.02 | - | - | Azure全球 | 中国区 欧洲区 北美区 | 超低成本nano模型,适合分类和子代理任务 |
| Azure | turing/gpt-5.3-codex | max_input_tokens: 400,000max_output_tokens: 128,000输入: 输出: 工具: 支持 思考: 支持 | v1/responses | 输入: $1.75输出: $14缓存输入: $0.175 | 2026-02-26 | - | Azure全球 | 中国区 欧洲区 北美区 | 仅支持 Response API, 支持推理token |
| Azure | turing/gpt-5.3-chat | max_input_tokens: 128,000max_output_tokens: 16,384输入: 输出: 工具: 支持 | v1/responsesv1/chat/completions | 输入: $1.75输出: $14缓存输入: $0.175 | 2026-03-16 | - | Azure全球 | 中国区 欧洲区 北美区 | |
| Azure | turing/gpt-5.2-codex | 输入: 输出: Tools: 支持 | v1/responses | 输入: $1.75输出: $14 | 2026-01-19 | - | 全球 | 中国区 欧洲区 北美区 | 仅支持 Response API |
| Azure | turing/gpt-5.1 | 输入: 输出: Tools: 支持 | v1/responsesv1/chat/completions | 输入: $1.25输出: $10 | 2025-08-10 | - | 全球 | 中国区 欧洲区 北美区 | - |
| Azure | turing/gpt-5.1-chat | 输入: 输出: Tools: 支持 | v1/responsesv1/chat/completions | 输入: $1.25输出: $10 | 2025-08-10 | - | 全球 | 中国区 欧洲区 北美区 | - |
| Azure | turing/gpt-5.1-codex | 输入: 输出: Tools: 支持 | v1/responsesv1/chat/completions | 输入: $1.25输出: $10 | 2025-08-10 | - | 全球 | 中国区 欧洲区 北美区 | - |
| Azure | turing/gpt-5.1-codex-mini | 输入: 输出: Tools: 支持 | v1/responsesv1/chat/completions | 输入: $0.25输出: $2 | 2025-08-10 | - | 全球 | 中国区 欧洲区 北美区 | - |
| Azure | turing/gpt-5 | 输入: 输出: Tools: 支持 | v1/responsesv1/chat/completions | 输入: $1.25输出: $10 | 2025-08-10 | - | 全球 | 中国区 欧洲区 北美区 | - |
| Azure | turing/gpt-5-mini | 输入: 输出: Tools: 支持 | v1/responsesv1/chat/completions | 输入: $0.25输出: $2 | 2025-08-10 | - | 全球 | 中国区 欧洲区 北美区 | - |
| Azure | turing/gpt-5-nano | 输入: 输出: Tools: 支持 | v1/responsesv1/chat/completions | 输入: $0.05输出: $0.4 | 2025-08-10 | - | 全球 | 中国区 欧洲区 北美区 | - |
| Azure | turing/gpt-5-chat | 输入: 输出: Tools: 支持 | v1/responsesv1/chat/completions | 输入: $1.25输出: $10 | 2025-08-10 | - | 全球 | 中国区 欧洲区 北美区 | - |
| Azure | turing/gpt-4.1 | 输入: 输出: Tools: 支持 | v1/responsesv1/chat/completions | 输入: $2输出: $8 | 2025-04-22 | - | 全球 | 中国区 欧洲区 北美区 | - |
| Azure | turing/gpt-4.1-mini | 输入: 输出: Tools: 支持 | v1/responsesv1/chat/completions | 输入: $0.4输出: $1.6 | 2025-04-22 | - | 全球 | 中国区 欧洲区 北美区 | - |
| Azure | turing/gpt-4.1-nano | 输入: 输出: Tools: 支持 | v1/responsesv1/chat/completions | 输入: $0.1输出: $0.4 | 2025-04-22 | - | 全球 | 中国区 欧洲区 北美区 | - |
| Azure | turing/o3 | 输入: 输出: Tools: 支持 | v1/responsesv1/chat/completions | 输入: $10输出: $40 | 2025-04-17 | - | 全球 | 中国区 欧洲区 北美区 | - |
| Azure | turing/o4-mini | 输入: 输出: Tools: 支持 | v1/responsesv1/chat/completions | 输入: $1.11输出: $4.4 | 2025-04-17 | - | 全球 | 中国区 欧洲区 北美区 | - |
| Azure | turing/o3-mini | 输入: 输出: Tools: 支持 | v1/responsesv1/chat/completions | 输入: $1.11输出: $4.4 | 2025-02-19 | - | 全球 | 中国区 欧洲区 北美区 | - |
| Azure | 输入: 输出: Tools: 不支持 | v1/responsesv1/chat/completions | 输入: $15输出: $60 | 2024-09-13 | - | 全球 | 中国区 欧洲区 北美区 | - |