聊天模型列表
OpenAI
| 厂商 | 接口模型ID | 模型能力 | endpoint | 价格(每百万 Tokens) | 负载与上下线 | 支持访问地区 | 备注 |
|---|---|---|---|---|---|---|---|
| Azure | turing/gpt-5.5 | API: v1/chat/completions, v1/messages, v1/responses SDK: OpenAI SDK / Anthropic SDK | 输入: $5输出: $30缓存读: $0.5 | Azure全球 | 中国区 欧洲区 北美区 亚太区 | 新一代旗舰模型,思考功能推荐使用 Response API | |
| Azure | turing/gpt-5.4 | API: v1/chat/completions, v1/messages, v1/responses SDK: OpenAI SDK / Anthropic SDK | 输入: $2.5输出: $15缓存读: $0.25 | Azure全球 | 中国区 欧洲区 北美区 亚太区 | 上一代升级版本,思考功能推荐使用 Response API | |
| Azure | turing/gpt-5.4-mini | API: v1/chat/completions, v1/messages, v1/responses SDK: OpenAI SDK / Anthropic SDK | 输入: $0.75输出: $4.5缓存读: $0.07 | Azure全球 | 中国区 欧洲区 北美区 亚太区 | 高性价比mini模型,思考功能推荐使用 Response API | |
| Azure | turing/gpt-5.4-nano | API: v1/chat/completions, v1/messages, v1/responses SDK: OpenAI SDK / Anthropic SDK | 输入: $0.2输出: $1.25缓存读: $0.02 | Azure全球 | 中国区 欧洲区 北美区 亚太区 | 超低成本nano模型,适合分类和子代理任务 | |
| Azure | turing/gpt-5.3-codex | API: v1/responses SDK: OpenAI SDK | 输入: $1.75输出: $14缓存读: $0.17 | Azure全球 上线: 2026-02-26 | 中国区 欧洲区 北美区 亚太区 | 仅支持 Response API, 支持推理token | |
| Azure | turing/gpt-5.3-chat | API: v1/chat/completions, v1/messages, v1/responses SDK: OpenAI SDK / Anthropic SDK | 输入: $1.75输出: $14缓存读: $0.17 | Azure全球 上线: 2026-03-16 | 中国区 欧洲区 北美区 亚太区 | ||
| Azure | turing/gpt-5.2 | API: v1/chat/completions, v1/messages, v1/responses SDK: OpenAI SDK / Anthropic SDK | 输入: $1.75输出: $14缓存读: $0.17 | Azure全球 上线: 2025-12-11 | 中国区 欧洲区 北美区 亚太区 | 升级版本,思考功能推荐使用 Response API | |
| Azure | turing/gpt-5.2-chat | API: v1/chat/completions, v1/messages, v1/responses SDK: OpenAI SDK / Anthropic SDK | 输入: $1.75输出: $14缓存读: $0.17 | Azure 全球 上线: 2025-12-11 | 中国区 欧洲区 北美区 亚太区 | 升级版本,思考功能推荐使用 Response API | |
| Azure | turing/gpt-5.2-codex | API: v1/responses SDK: OpenAI SDK | 输入: $1.75输出: $14缓存读: $0.17 | Azure 全球 上线: 2025-12-11 | 中国区 欧洲区 北美区 亚太区 | 仅支持 Response API | |
| Azure | turing/gpt-5.1 | API: v1/chat/completions, v1/messages, v1/responses SDK: OpenAI SDK / Anthropic SDK | 输入: $1.25输出: $10缓存读: $0.12 | Azure 全球 上线: 2025-11-13 | 中国区 欧洲区 北美区 亚太区 | 升级版本,思考功能推荐使用 Response API | |
| Azure | turing/gpt-5.1-chat | API: v1/chat/completions, v1/messages, v1/responses SDK: OpenAI SDK / Anthropic SDK | 输入: $1.25输出: $10缓存读: $0.12 | Azure 全球 上线: 2025-11-13 | 中国区 欧洲区 北美区 亚太区 | 升级版本,思考功能推荐使用 Response API | |
| Azure | turing/gpt-5.1-codex | API: v1/chat/completions, v1/responses SDK: OpenAI SDK | 输入: $1.25输出: $10缓存读: $0.12 | Azure 全球 上线: 2025-08-10 | 中国区 欧洲区 北美区 亚太区 | 思考功能推荐使用 Response API | |
| Azure | turing/gpt-5.1-codex-mini | API: v1/chat/completions, v1/responses SDK: OpenAI SDK | 输入: $0.25输出: $2缓存读: $0.03 | Azure 全球 上线: 2025-08-10 | 中国区 欧洲区 北美区 亚太区 | 思考功能推荐使用 Response API | |
| Azure | turing/gpt-5 | API: v1/chat/completions, v1/messages, v1/responses SDK: OpenAI SDK / Anthropic SDK | 输入: $1.25输出: $10缓存读: $0.12 | Azure 全球 上线: 2025-08-10 | 中国区 欧洲区 北美区 亚太区 | 思考功能推荐使用 Response API | |
| Azure | turing/gpt-5-mini | API: v1/chat/completions, v1/messages, v1/responses SDK: OpenAI SDK / Anthropic SDK | 输入: $0.25输出: $2缓存读: $0.03 | Azure 全球 上线: 2025-08-10 | 中国区 欧洲区 北美区 亚太区 | 思考功能推荐使用 Response API | |
| Azure | turing/gpt-5-nano | API: v1/chat/completions, v1/messages, v1/responses SDK: OpenAI SDK / Anthropic SDK | 输入: $0.05输出: $0.4缓存读: $0.01 | Azure 全球 上线: 2025-08-10 | 中国区 欧洲区 北美区 亚太区 | 思考功能推荐使用 Response API | |
| Azure | turing/gpt-5-chat | API: v1/chat/completions, v1/messages, v1/responses SDK: OpenAI SDK / Anthropic SDK | 输入: $1.25输出: $10缓存读: $0.12 | Azure 全球 上线: 2025-08-10 预计下线: 2026-04-15 | 中国区 欧洲区 北美区 亚太区 | 思考功能推荐使用 Response API | |
| Azure | turing/o3 | API: v1/chat/completions, v1/messages, v1/responses SDK: OpenAI SDK / Anthropic SDK | 输入: $10输出: $40缓存读: $0.5 | Azure 全球 上线: 2025-04-17 | 中国区 欧洲区 北美区 亚太区 | 思考模型,推荐使用 Response API | |
| Azure | turing/gpt-4.1 | API: v1/chat/completions, v1/messages, v1/responses SDK: OpenAI SDK / Anthropic SDK | 输入: $2输出: $8缓存读: $0.50 | Azure 全球 上线: 2025-04-16 | 中国区 欧洲区 北美区 亚太区 | ||
| Azure | turing/o4-mini | API: v1/chat/completions, v1/messages, v1/responses SDK: OpenAI SDK / Anthropic SDK | 输入: $1.11输出: $4.4缓存读: $0.28 | Azure 全球 上线: 2025-04-16 | 中国区 欧洲区 北美区 亚太区 | 思考模型,推荐使用 Response API | |
| Azure | turing/gpt-4.1-mini | API: v1/chat/completions, v1/messages, v1/responses SDK: OpenAI SDK / Anthropic SDK | 输入: $0.4输出: $1.6缓存读: $0.10 | Azure 全球 上线: 2025-04-14 | 中国区 欧洲区 北美区 亚太区 | ||
| Azure | turing/gpt-4.1-nano | API: v1/chat/completions, v1/messages, v1/responses SDK: OpenAI SDK / Anthropic SDK | 输入: $0.1输出: $0.4缓存读: $0.03 | Azure 全球 上线: 2025-04-14 | 中国区 欧洲区 北美区 亚太区 | ||
| Azure | turing/o3-mini | API: v1/chat/completions, v1/messages, v1/responses SDK: OpenAI SDK / Anthropic SDK | 输入: $1.11输出: $4.4缓存读: $0.55 | Azure 全球 上线: 2025-01-31 | 中国区 欧洲区 北美区 亚太区 | 思考模型,推荐使用 Response API | |
| Azure | turing/gpt-4o-mini | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 输入: $0.15输出: $0.6缓存读: $0.07 | Azure 全球 上线: 2024-07-19 预计下线: 2026-03-31 | 中国区 欧洲区 北美区 亚太区 | ||
| Azure | turing/gpt-4o | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 输入: $2.5输出: $10缓存读: $1.25 | Azure 全球 上线: 2024-05-14 | 中国区 欧洲区 北美区 亚太区 |
Gemini
Gemini 模型负载说明
Gemini 系列模型基于 Google Cloud Vertex AI 共享配额运行,吞吐量无法保证,高并发场景下可能频繁触发 429 限流。不推荐在对稳定性有严格要求的生产环境中直接使用。 图灵平台提供 Retry 与 Fallback 作为工程化缓解手段,但无法根本解决共享配额问题,且 Fallback 切换模型后输出可能不一致。如需根本解决,需额外购买 Provisioned Throughput(预配吞吐量)。 详见:Gemini 429 限流与预配吞吐量
| 厂商 | 接口模型ID | 模型能力 | endpoint | 价格(每百万 Tokens) | 负载与上下线 | 支持访问地区 | 备注 |
|---|---|---|---|---|---|---|---|
| Vertex AI | turing/gemini-3.5-flash | max_input_tokens: 1,048,576max_output_tokens: 65,535输出: 工具: 支持 思考: 支持 缓存: 支持 内容审核: 支持 content moderation 内置工具: 🔍 网页搜索 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | Vertex AI 共享配额 上线: 2026-05-19 | 中国区 欧洲区 北美区 亚太区 | 最新版本 支持思考模式 & 内置网页搜索 | |
| Vertex AI | turing/gemini-3.1-pro-latest | max_input_tokens: 1,048,576max_output_tokens: 65,536输出: 工具: 支持 思考: 支持 缓存: 支持 内容审核: 支持 content moderation 内置工具: 🔍 网页搜索 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | Vertex AI 共享配额 上线: 2026-02-19 | 中国区 欧洲区 北美区 亚太区 | 最新版本 支持思考模式(含 MEDIUM 级别)& 内置网页搜索 | |
| Vertex AI | turing/gemini-3.1-flash-lite-latest | max_input_tokens: 1,048,576max_output_tokens: 65,535输出: 工具: 支持 思考: 支持 内容审核: 支持 content moderation 内置工具: 🔍 网页搜索 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | Vertex AI 共享配额 上线: 2025-12-18 | 中国区 欧洲区 北美区 亚太区 | 最新版本 支持思考模式 & 内置网页搜索 | |
| Vertex AI | turing/gemini-3.1-flash-image | max_input_tokens: 131,072max_output_tokens: 32,768输出: 工具: 支持 思考: 支持 内容审核: 支持 content moderation 内置工具: 🔍 网页搜索 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | Vertex AI 共享配额 上线: 2025-12-18 | 中国区 欧洲区 北美区 亚太区 | 最新版本 支持思考模式 & 输出图像 | |
| Vertex AI | turing/gemini-3.1-flash-lite-image | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | Vertex AI 共享配额 上线: 2026-07-01 | 中国区 欧洲区 北美区 亚太区 | Nano Banana 2 Lite,轻量图像生成,输出分辨率最高 1K | ||
| Vertex AI | turing/gemini-3-flash-latest | max_input_tokens: 1,048,576max_output_tokens: 65,536输出: 工具: 支持 思考: 支持 内容审核: 支持 content moderation 内置工具: 🔍 网页搜索 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | Vertex AI 共享配额 上线: 2025-12-18 预计下线: 2026-06-15 | 中国区 欧洲区 北美区 亚太区 | 支持思考模式 & 内置网页搜索 | |
| Vertex AI | turing/gemini-3-pro-image | max_input_tokens: 65,000max_output_tokens: 32,000输出: 工具: - 思考: 支持 内容审核: 支持 content moderation 内置工具: 🔍 网页搜索 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | Vertex AI 共享配额 上线: 2025-11-19 | 中国区 欧洲区 北美区 亚太区 | 最新版本 支持思考模式 | |
| Vertex AI | turing/gemini-2.5-flash-image | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | Vertex AI 共享配额 上线: 2025-09-12 | 中国区 欧洲区 北美区 亚太区 | -(Nano Banana) | ||
| Vertex AI | turing/gemini-2.5-flash-latest | max_input_tokens: 1,048,576max_output_tokens: 65,535输出: 工具: 支持 思考: 支持 内容审核: 支持 content moderation 内置工具: 🔍 网页搜索 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | Vertex AI 共享配额 上线: 2025-07-17 预计下线: 2026-06-15 | 中国区 欧洲区 北美区 亚太区 | 支持思考模式 & 内置网页搜索 | |
| Vertex AI | turing/gemini-2.5-flash-lite-latest | max_input_tokens: 1,048,576max_output_tokens: 65,535输出: 工具: 支持 思考: 支持 内容审核: 支持 content moderation 内置工具: 🔍 网页搜索 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | Vertex AI 共享配额 上线: 2025-07-17 预计下线: 2026-06-15 | 中国区 欧洲区 北美区 亚太区 | 支持思考模式 & 内置网页搜索 | |
| Vertex AI | turing/gemini-2.5-pro | max_input_tokens: 131,072max_output_tokens: 131,072输出: 工具: 支持 思考: 支持 缓存: 支持 内容审核: 支持 content moderation 内置工具: 🔍 网页搜索 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | Vertex AI 共享配额 上线: 2025-06-18 | 中国区 欧洲区 北美区 亚太区 | 支持思考模式 & 内置网页搜索 |
Claude
警告
由于 Anthropic 政策限制,Claude 系列模型随时可能不可用,建议仅在个人项目中试用。
| 厂商 | 接口模型ID | 模型能力 | endpoint | 价格(每百万 Tokens) | 负载与上下线 | 支持访问地区 | 备注 |
|---|---|---|---|---|---|---|---|
| Anthropic | turing/claude-sonnet-5 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 输入: $2输出: $10缓存读: $0.2缓存写 5m: $2.5缓存写 1h: $4网页搜索: $10 / 1K促销价有效期至 2026-08-31;2026-09-01 起标准价为输入 $3 / 输出 $15 / 缓存读 $0.3 / 缓存写 $3.75(5m)、$6(1h) → | Vertex AI(全球部署) 上线: 2026-07-01 | 中国区 欧洲区 北美区 亚太区 | 最新 Sonnet 模型,默认开启 adaptive 思考;不支持 enabled/budget_tokens,支持工具、显式缓存与联网搜索 | |
| Anthropic | turing/claude-fable-5 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 输入: $10输出: $50缓存读: $1缓存写 5m: $12.5缓存写 1h: $20网页搜索: $10 / 1K | Vertex AI(全球部署) | 中国区 欧洲区 北美区 亚太区 | 新一代 Claude 模型,adaptive 思考始终开启且不可禁用;支持工具、显式缓存与联网搜索;严禁用于模型蒸馏,违者图灵平台有权追究责任 | |
| Anthropic | turing/claude-opus-4.8 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 输入: $5输出: $25缓存读: $0.5缓存写 5m: $6.25缓存写 1h: $10网页搜索: $10 / 1K | Vertex AI(全球部署) 上线: 2026-06-01 | 中国区 欧洲区 北美区 亚太区 | 支持工具,仅支持 adaptive 思考模式(默认关闭,需显式传 thinking.type=adaptive) | |
| Anthropic | turing/claude-opus-4.7 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 输入: $5输出: $25缓存读: $0.5缓存写 5m: $6.25缓存写 1h: $10网页搜索: $10 / 1K | Vertex AI(全球部署) 上线: 2026-04-15 | 中国区 欧洲区 北美区 亚太区 | 支持工具,仅支持 adaptive 思考模式(默认关闭,需显式传 thinking.type=adaptive) | |
| Anthropic | turing/claude-opus-4.6 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 输入: $5输出: $25缓存读: $0.5缓存写 5m: $6.25缓存写 1h: $10网页搜索: $10 / 1K | Vertex AI(全球部署) 上线: 2026-02-25 | 中国区 欧洲区 北美区 亚太区 | 支持工具,推荐使用 adaptive 思考模式 | |
| Anthropic | turing/claude-sonnet-4.6 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 输入: $3输出: $15缓存读: $0.3缓存写 5m: $3.75缓存写 1h: $6网页搜索: $10 / 1K | Vertex AI(全球部署) 上线: 2026-02-25 | 中国区 欧洲区 北美区 亚太区 | 最新版本 支持工具 | |
| Anthropic | turing/claude-haiku-4.5 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 输入: $1输出: $5缓存读: $0.1缓存写 5m: $1.25缓存写 1h: $2网页搜索: $10 / 1K | Vertex AI(全球部署) 上线: 2026-01-19 | 中国区 欧洲区 北美区 亚太区 | 支持工具 | |
| Anthropic | turing/claude-opus-4.5 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 输入: $5输出: $25缓存读: $0.5缓存写 5m: $6.25缓存写 1h: $10网页搜索: $10 / 1K | Vertex AI(全球部署) 上线: 2026-01-19 | 中国区 欧洲区 北美区 亚太区 | 支持工具 | |
| Anthropic | turing/claude-4.5-sonnet | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 输入: $3输出: $15缓存读: $0.3缓存写 5m: $3.75缓存写 1h: $6网页搜索: $10 / 1K分阶梯收费:超过 200K 输入后 输入/输出/缓存 翻倍 | Vertex AI(全球部署) 上线: 2025-09-29 | 中国区 欧洲区 北美区 亚太区 | 支持工具,分阶梯收费 | |
| Anthropic | turing/claude-4.5-sonnet-reasoning | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 输入: $3输出: $15缓存读: $0.3缓存写 5m: $3.75缓存写 1h: $6网页搜索: $10 / 1K分阶梯收费:超过 200K 输入后 输入/输出/缓存 翻倍 | Vertex AI(全球部署) 上线: 2025-09-29 | 中国区 欧洲区 北美区 亚太区 | 支持工具,分阶梯收费 | |
| Anthropic | turing/claude-4-sonnet-latest | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 输入: $3输出: $15缓存读: $0.3缓存写 5m: $3.75缓存写 1h: $6 | AWS Bedrock(美国、新加坡) 上线: 2025-05-14 | 中国区 欧洲区 北美区 亚太区 | 支持工具 | |
| Anthropic | turing/claude-4-sonnet-reasoning-latest | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 输入: $3输出: $15缓存读: $0.3缓存写 5m: $3.75缓存写 1h: $6 | AWS Bedrock(美国、新加坡) 上线: 2025-05-14 | 中国区 欧洲区 北美区 亚太区 | 支持工具 | |
| Anthropic | turing/claude-4-opus-latest | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 输入: $15输出: $75缓存读: $1.5缓存写 5m: $18.75缓存写 1h: $30 | AWS Bedrock(美国) 上线: 2025-05-14 | 中国区 欧洲区 北美区 亚太区 | 支持工具 | |
| Anthropic | turing/claude-4-opus-reasoning-latest | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 输入: $15输出: $75缓存读: $1.5缓存写 5m: $18.75缓存写 1h: $30 | AWS Bedrock(美国) 上线: 2025-05-14 | 中国区 欧洲区 北美区 亚太区 | 支持工具 |
字节火山
| 厂商 | 接口模型ID | 模型能力 | endpoint | 价格(每百万 Tokens) | 负载与上下线 | 支持访问地区 | 备注 |
|---|---|---|---|---|---|---|---|
| 字节火山 | doubao-seed-2.1-pro | API: v1/chat/completions, v1/responses SDK: OpenAI SDK | 字节火山 上线: 2026-06-24 | 中国区 | Seed 2.1 旗舰版,支持视频理解 | ||
| 字节火山 | doubao-seed-2.1-turbo | API: v1/chat/completions, v1/responses SDK: OpenAI SDK | 字节火山 上线: 2026-06-24 | 中国区 | Seed 2.1 均衡版,支持视频理解 + GUI Agent | ||
| 字节火山 | doubao-seed-2-0-pro-260215 | API: v1/chat/completions, v1/responses SDK: OpenAI SDK | 字节火山 上线: 2026-02-25 | 中国区 | 最新版本 Seed 2.0 旗舰版,支持视频理解 | ||
| 字节火山 | doubao-seed-2-0-lite-260215 | API: v1/chat/completions, v1/responses SDK: OpenAI SDK | 字节火山 上线: 2026-02-25 | 中国区 | 最新版本 Seed 2.0 中端版,支持视频理解 | ||
| 字节火山 | doubao-seed-2-0-mini-260215 | API: v1/chat/completions, v1/responses SDK: OpenAI SDK | 字节火山 上线: 2026-02-25 | 中国区 | 最新版本 Seed 2.0 轻量版,支持视频理解 | ||
| 字节火山 | doubao-seed-2-0-code-preview-260215 | API: v1/chat/completions, v1/responses SDK: OpenAI SDK | 字节火山 上线: 2026-02-25 | 中国区 | 代码预览版 | ||
| 字节火山 | doubao-seedream-3-0-t2i-250415 | 输入: 输出: 工具: 不支持 | API: v1/chat/completions SDK: OpenAI SDK | 输入: ¥0.2591 per image输出: ¥0.2591 per image | 字节火山 上线: 2025-09-15 | 中国区 | |
| 字节火山 | bytedance/deepseek-v3 | 输入: 输出: 工具: 不支持 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 输入: ¥2输出: ¥8 | 字节火山 上线: 2025-01-02 | 中国区 | 不支持temperature/top_p/max_tokens等参数 |
| 字节火山 | doubao-pro-128k | 输入: 输出: 工具: 支持 | API: v1/chat/completions SDK: OpenAI SDK | 输入: ¥5输出: ¥9 | 字节火山 上线: 2024-06-12 | 中国区 | |
| 字节火山 | doubao-pro-32k | 输入: 输出: 工具: 支持 | API: v1/chat/completions, v1/responses SDK: OpenAI SDK | 输入: ¥0.8输出: ¥2 | 字节火山 上线: 2024-06-12 | 中国区 | |
| 字节火山 | doubao-pro-4k | 输入: 输出: 工具: 支持 | API: v1/chat/completions SDK: OpenAI SDK | 输入: ¥0.8输出: ¥2 | 字节火山 上线: 2024-06-12 | 中国区 |
阿里 DashScope
| 厂商 | 接口模型ID | 模型能力 | endpoint | 价格(每百万 Tokens) | 负载与上下线 | 支持访问地区 | 备注 |
|---|---|---|---|---|---|---|---|
| 阿里DashScope | qwen3.7-plus | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 阿里云 上线: 2026-06-08 | 中国区 | 高性价比版 3.7,视觉-语言(图像输入) | ||
| 阿里DashScope | qwen3.7-max | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 阿里云 上线: 2026-05-28 | 中国区 | 旗舰版 3.7 | ||
| 阿里DashScope | qwen3.6-plus | API: v1/chat/completions, v1/messages, v1/responses SDK: OpenAI SDK / Anthropic SDK | 阿里云 上线: 2026-04-03 | 中国区 | 稳定版,当前与 qwen3.6-plus-2026-04-02 能力相同 | ||
| 阿里DashScope | qwen3.6-flash | API: v1/chat/completions, v1/messages, v1/responses SDK: OpenAI SDK / Anthropic SDK | 阿里云 上线: 2026-04-23 | 中国区 | 轻量版 3.6 | ||
| 阿里DashScope | qwen3.6-max | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 阿里云 上线: 2026-04-23 预计下线: 2026-09-08 | 中国区 | 旗舰版 3.6 | ||
| 阿里DashScope | qwen3.5-plus | API: v1/chat/completions, v1/messages, v1/responses SDK: OpenAI SDK / Anthropic SDK | 阿里云 上线: 2026-02-25 | 中国区 | 快照版本 | ||
| 阿里DashScope | qwen3.5-flash | API: v1/chat/completions, v1/messages, v1/responses SDK: OpenAI SDK / Anthropic SDK | 阿里云 上线: 2026-02-25 | 中国区 | 快照版本 | ||
| 阿里DashScope | qwen3.5-397b-a17b | API: v1/chat/completions SDK: OpenAI SDK | 阿里云 上线: 2026-02-25 | 中国区 | 开源版旗舰模型,默认开启思考模式 | ||
| 阿里DashScope | qwen3.5-122b-a10b | API: v1/chat/completions SDK: OpenAI SDK | 阿里云 上线: 2026-02-25 | 中国区 | 开源版,默认开启思考模式 | ||
| 阿里DashScope | qwen3.5-27b | API: v1/chat/completions SDK: OpenAI SDK | 阿里云 上线: 2026-02-25 | 中国区 | 开源版密集模型,默认开启思考模式 | ||
| 阿里DashScope | qwen3.5-35b-a3b | API: v1/chat/completions SDK: OpenAI SDK | 阿里云 上线: 2026-02-25 | 中国区 | 开源版轻量MoE模型,默认开启思考模式 | ||
| 阿里DashScope | qwen3-max-preview | API: v1/chat/completions SDK: OpenAI SDK | 阿里云 上线: 2025-09-17 预计下线: 2026-09-08 | 中国区 | |||
| 阿里DashScope | qwen-plus-latest | API: v1/chat/completions SDK: OpenAI SDK | 阿里云 上线: 2025-09-17 | 中国区 | 注意 默认开启思考模式,关闭请传入参数 "enable_thinking": False | ||
| 阿里DashScope | qwen3-coder-plus | max_input_tokens: 1,000,000max_output_tokens: 65,536输入: 输出: 工具: 支持 | API: v1/chat/completions SDK: OpenAI SDK | 阿里云 上线: 2025-09-15 预计下线: 2026-07-08 | 中国区 | ||
| 阿里DashScope | qwen3-coder-plus-2025-07-22 | max_input_tokens: 1,000,000max_output_tokens: 65,536输入: 输出: 工具: 支持 | API: v1/chat/completions SDK: OpenAI SDK | 阿里云 上线: 2025-09-15 预计下线: 2026-07-08 | 中国区 | ||
| 阿里DashScope | qwen3-235b-a22b-thinking-2507 | API: v1/chat/completions SDK: OpenAI SDK | 输入: ¥2输出: ¥20 | 阿里云 上线: 2025-09-15 预计下线: 2026-07-08 | 中国区 | ||
| 阿里DashScope | qwen3-30b-a3b-thinking-2507 | API: v1/chat/completions SDK: OpenAI SDK | 输入: ¥0.75输出: ¥7.5 | 阿里云 上线: 2025-09-15 预计下线: 2026-07-08 | 中国区 | ||
| 阿里DashScope | qwen3-vl-plus | API: v1/chat/completions SDK: OpenAI SDK | 阿里云 上线: 2026-03-02 | 中国区 | |||
| 阿里DashScope | qwen3-vl-flash | API: v1/chat/completions SDK: OpenAI SDK | 阿里云 上线: 2026-03-02 预计下线: 2026-09-08 | 中国区 | |||
| 阿里DashScope | qwen-flash | API: v1/chat/completions SDK: OpenAI SDK | 阿里云 上线: 2025-08-21 | 中国区 | |||
| 阿里DashScope | qwen3-235b-a22b | API: v1/chat/completions SDK: OpenAI SDK | 输入: ¥2输出: ¥8 | 阿里云 上线: 2025-04-29 预计下线: 2026-07-08 | 中国区 | 注意 不支持非流式,默认开启思考模式,关闭请传入参数 "enable_thinking": False | |
| 阿里DashScope | qwen3-32b | API: v1/chat/completions SDK: OpenAI SDK | 输入: ¥2输出: ¥8 | 阿里云 上线: 2025-04-29 预计下线: 2026-07-08 | 中国区 | 注意 不支持非流式,默认开启思考模式,关闭请传入参数 "enable_thinking": False | |
| 阿里DashScope | qwen3-30b-a3b | API: v1/chat/completions SDK: OpenAI SDK | 输入: ¥0.75输出: ¥3 | 阿里云 上线: 2025-04-29 预计下线: 2026-07-08 | 中国区 | 注意 不支持非流式,默认开启思考模式,关闭请传入参数 "enable_thinking": False | |
| 阿里DashScope | qwen3-14b | API: v1/chat/completions SDK: OpenAI SDK | 输入: ¥1输出: ¥4 | 阿里云 上线: 2025-04-29 预计下线: 2026-07-08 | 中国区 | 注意 不支持非流式,默认开启思考模式,关闭请传入参数 "enable_thinking": False | |
| 阿里DashScope | qwen3-8b | API: v1/chat/completions SDK: OpenAI SDK | 输入: ¥0.5输出: ¥2 | 阿里云 上线: 2025-04-29 预计下线: 2026-07-08 | 中国区 | 注意 不支持非流式,默认开启思考模式,关闭请传入参数 "enable_thinking": False | |
| 阿里DashScope | qwen-vl-max | API: v1/chat/completions SDK: OpenAI SDK | 输入: ¥1.6输出: ¥4 | 阿里云 上线: 2025-04-22 预计下线: 2026-07-13 | 中国区 | ||
| 阿里DashScope | qwq-plus | API: v1/chat/completions SDK: OpenAI SDK | 输入: ¥1.6输出: ¥4 | 阿里云 上线: 2025-04-16 预计下线: 2026-07-13 | 中国区 | ||
| 阿里DashScope | qwen-long | 输入: 输出: 工具: 支持 | API: v1/chat/completions SDK: OpenAI SDK | 输入: ¥0.5输出: ¥2 | 阿里云 上线: 2024-07-05 | 中国区 | |
| 阿里DashScope | qwen-turbo | API: v1/chat/completions SDK: OpenAI SDK | 输入: ¥0.3输出: ¥0.6 | 阿里云 上线: 2024-07-01 预计下线: 2026-07-13 | 中国区 | ||
| 阿里DashScope | qwen-plus | API: v1/chat/completions SDK: OpenAI SDK | 阿里云 上线: 2024-07-01 | 中国区 | |||
| 阿里DashScope | qwen-max | API: v1/chat/completions SDK: OpenAI SDK | 输入: ¥2.4输出: ¥9.6 | 阿里云 上线: 2024-07-01 预计下线: 2026-07-13 | 中国区 |
Deepseek
| 厂商 | 接口模型ID | 模型能力 | endpoint | 价格(每百万 Tokens) | 负载与上下线 | 支持访问地区 | 备注 |
|---|---|---|---|---|---|---|---|
| Deepseek | deepseek-v4-pro | API: v1/chat/completions, v1/messages SDK: OpenAI SDK | 输入: ¥12输出: ¥24缓存读: ¥2.4 | 阿里云 上线: 2026-04-25 | 中国区 | ||
| Deepseek | deepseek-v4-flash | API: v1/chat/completions, v1/messages SDK: OpenAI SDK | 输入: ¥1输出: ¥2缓存读: ¥0.2 | 阿里云 上线: 2026-04-25 | 中国区 | ||
| Deepseek | turing/deepseek-v3-2 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK | 输入: ¥2输出: ¥3[0, 32] 输入: ¥2 输出: ¥3 / (32, 128] 输入: ¥4 输出: ¥6 | 火山引擎(中国) 上线: 2025-12-11 | 中国区 | ||
| Deepseek | turing/deepseek-r1 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK | 输入: ¥4输出: ¥16 | 阿里、火山(中国) 上线: 2025-02-25 | 中国区 |
智谱
| 厂商 | 接口模型ID | 模型能力 | endpoint | 价格(每百万 Tokens) | 负载与上下线 | 支持访问地区 | 备注 |
|---|---|---|---|---|---|---|---|
| 智谱 | glm-5.2 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 智谱 上线: 2026-06-17 | 中国区 | 最新旗舰,1M 上下文 | ||
| 智谱 | glm-5.1 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 智谱 上线: 2026-04-09 | 中国区 | |||
| 智谱 | glm-5 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 智谱 上线: 2026-02-24 | 中国区 | |||
| 智谱 | glm-4.7 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 智谱 上线: 2025-12-23 | 中国区 | |||
| 智谱 | glm-4.6 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 智谱 上线: 2025-11-11 | 中国区 |
MiniMax
| 厂商 | 接口模型ID | 模型能力 | endpoint | 价格(每百万 Tokens) | 负载与上下线 | 支持访问地区 | 备注 |
|---|---|---|---|---|---|---|---|
| MiniMax | minimax-m3 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 输入: ¥2.1输出: ¥8.4缓存读: ¥0.42限时 5 折;上下文 512K-1M 输入 ¥4.2 / 输出 ¥16.8 / 缓存读 ¥0.84 | MiniMax 上线: 2026-06-17 | 中国区 | MiniMax M3 | |
| MiniMax | minimax-m2.7 | max_input_tokens: 204,800max_output_tokens: 131,072输入: 输出: 工具: 支持 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 输入: ¥2.1输出: ¥8.4 | 阿里云 上线: 2026-03-23 | 中国区 | 最新版本 M2.7 |
| MiniMax | minimax-m2.5-highspeed | max_input_tokens: 204,800max_output_tokens: 204,800输入: 输出: 工具: 支持 | API: v1/chat/completions SDK: OpenAI SDK | 输入: ¥4.2输出: ¥16.8 | MiniMax 上线: 2026-02-25 | 中国区 | |
| MiniMax | minimax-m2.5 | max_input_tokens: 204,800max_output_tokens: 204,800输入: 输出: 工具: 支持 | API: v1/chat/completions SDK: OpenAI SDK | 输入: ¥2.1输出: ¥8.4 | MiniMax 上线: 2026-02-25 | 中国区 | |
| MiniMax | abab5.5-chat | 输入: 输出: 工具: 支持 | API: v1/chat/completions SDK: OpenAI SDK | 输入: ¥15输出: ¥15 | MiniMax 上线: 2025-04-22 | 中国区 | |
| MiniMax | abab5.5s-chat | 输入: 输出: 工具: 支持 | API: v1/chat/completions SDK: OpenAI SDK | 输入: ¥5输出: ¥5 | MiniMax 上线: 2025-04-22 | 中国区 | |
| MiniMax | abab6-chat | 输入: 输出: 工具: 支持 | API: v1/chat/completions SDK: OpenAI SDK | 输入: ¥100输出: ¥100 | MiniMax 上线: 2025-04-22 | 中国区 | |
| MiniMax | abab6.5-chat | 输入: 输出: 工具: 支持 | API: v1/chat/completions SDK: OpenAI SDK | 输入: ¥30输出: ¥30 | MiniMax 上线: 2025-04-22 | 中国区 | |
| MiniMax | abab6.5s-chat | 输入: 输出: 工具: 支持 | API: v1/chat/completions SDK: OpenAI SDK | 输入: ¥1输出: ¥1 | MiniMax 上线: 2025-04-22 | 中国区 | |
| MiniMax | minimax-text-01 | 输入: 输出: 工具: 支持 | API: v1/chat/completions SDK: OpenAI SDK | 输入: ¥1输出: ¥1 | MiniMax 上线: 2025-04-02 | 中国区 |
KIMI
| 厂商 | 接口模型ID | 模型能力 | endpoint | 价格(每百万 Tokens) | 负载与上下线 | 支持访问地区 | 备注 |
|---|---|---|---|---|---|---|---|
| KIMI | kimi-k2.7-code | API: v1/chat/completions SDK: OpenAI SDK | 阿里云 上线: 2026-06-17 | 中国区 | Kimi 代码模型,支持文本、图片与视频输入,适合编程、对话与 Agent 任务 | ||
| KIMI | kimi-k2.6 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 输入: ¥6.5输出: ¥27缓存读: ¥1.3缓存写 5m: ¥8.125 | 阿里云 上线: 2026-05-08 | 中国区 | 最新版本 | |
| KIMI | kimi-k2.5 | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 输入: ¥4输出: ¥21 | 阿里云 上线: 2026-03-02 | 中国区 | ||
| KIMI | turing/kimi-k2-thinking | API: v1/chat/completions, v1/messages SDK: OpenAI SDK / Anthropic SDK | 输入: ¥4输出: ¥16 | 月之暗面 上线: 2025-11-17 预计下线: 2026-07-08 | 中国区 |
小米 MiMo
Bedrock
| 厂商 | 接口模型ID | 模型能力 | endpoint | 价格(每百万 Tokens) | 负载与上下线 | 支持访问地区 | 备注 |
|---|---|---|---|---|---|---|---|
| Bedrock | nova-lite-v1 | max_input_tokens: 290,000max_output_tokens: 10,000输入: 输出: 工具: 支持 | API: v1/chat/completions SDK: OpenAI SDK | 输入: $0.06输出: $0.24 | AWS Bedrock(美国) 上线: 2025-08-21 | 中国区 欧洲区 北美区 亚太区 | |
| Bedrock | turing/titan-nove-lite-v1 | max_input_tokens: 290,000max_output_tokens: 10,000输入: 输出: 工具: 支持 | API: v1/chat/completions SDK: OpenAI SDK | 输入: $0.06输出: $0.24 | AWS Bedrock(美国) 上线: 2025-08-21 | 中国区 欧洲区 北美区 亚太区 |
Grok
| 厂商 | 接口模型ID | 模型能力 | endpoint | 价格(每百万 Tokens) | 负载与上下线 | 支持访问地区 | 备注 |
|---|---|---|---|---|---|---|---|
| xAI | turing/grok-4.3 | API: v1/chat/completions, v1/messages, v1/responses SDK: OpenAI SDK / Anthropic SDK | 输入: $1.25输出: $2.5缓存读: $0.2 | xAI API 上线: 2026-05-28 | 中国区 欧洲区 北美区 亚太区 | ||
| xAI | turing/grok-4-0709 | max_input_tokens: 256,000max_output_tokens: 256,000输入: 输出: 工具: 支持 | API: v1/chat/completions, v1/messages, v1/responses SDK: OpenAI SDK / Anthropic SDK | 输入: $3输出: $15 | xAI API 上线: 2025-10-13 | 中国区 欧洲区 北美区 亚太区 | |
| xAI | turing/grok-4-fast-non-reasoning | max_input_tokens: 2,000,000max_output_tokens: 2,000,000输入: 输出: 工具: 不支持 | API: v1/chat/completions, v1/messages, v1/responses SDK: OpenAI SDK / Anthropic SDK | 输入: $0.2输出: $0.5 | xAI API 上线: 2025-10-13 | 中国区 欧洲区 北美区 亚太区 | |
| xAI | turing/grok-4-fast-reasoning | API: v1/chat/completions, v1/messages, v1/responses SDK: OpenAI SDK / Anthropic SDK | 输入: $0.2输出: $0.5 | xAI API 上线: 2025-10-13 | 中国区 欧洲区 北美区 亚太区 |