跳到主要内容

聊天模型列表

OpenAI

筛选25/30
厂商接口模型ID模型能力endpoint价格(每百万 Tokens)负载与上下线支持访问地区备注
Azureturing/gpt-5.5
max_input_tokens: 922,000
max_output_tokens: 128,000
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions, v1/messages, v1/responses
SDK: OpenAI SDK / Anthropic SDK
输入: $5
输出: $30
缓存读: $0.5
Azure全球
中国区
欧洲区
北美区
亚太区
新一代旗舰模型,思考功能推荐使用 Response API
Azureturing/gpt-5.4
max_input_tokens: 922,000
max_output_tokens: 128,000
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions, v1/messages, v1/responses
SDK: OpenAI SDK / Anthropic SDK
输入: $2.5
输出: $15
缓存读: $0.25
Azure全球
中国区
欧洲区
北美区
亚太区
上一代升级版本,思考功能推荐使用 Response API
Azureturing/gpt-5.4-mini
max_input_tokens: 400,000
max_output_tokens: 128,000
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions, v1/messages, v1/responses
SDK: OpenAI SDK / Anthropic SDK
输入: $0.75
输出: $4.5
缓存读: $0.07
Azure全球
中国区
欧洲区
北美区
亚太区
高性价比mini模型,思考功能推荐使用 Response API
Azureturing/gpt-5.4-nano
max_input_tokens: 400,000
max_output_tokens: 128,000
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions, v1/messages, v1/responses
SDK: OpenAI SDK / Anthropic SDK
输入: $0.2
输出: $1.25
缓存读: $0.02
Azure全球
中国区
欧洲区
北美区
亚太区
超低成本nano模型,适合分类和子代理任务
Azureturing/gpt-5.3-codex
max_input_tokens: 400,000
max_output_tokens: 128,000
输入:
输出:
工具: 支持
思考: 支持
API: v1/responses
SDK: OpenAI SDK
输入: $1.75
输出: $14
缓存读: $0.17
Azure全球
上线: 2026-02-26
中国区
欧洲区
北美区
亚太区
仅支持 Response API, 支持推理token
Azureturing/gpt-5.3-chat
max_input_tokens: 128,000
max_output_tokens: 16,384
输入:
输出:
工具: 支持
API: v1/chat/completions, v1/messages, v1/responses
SDK: OpenAI SDK / Anthropic SDK
输入: $1.75
输出: $14
缓存读: $0.17
Azure全球
上线: 2026-03-16
中国区
欧洲区
北美区
亚太区
Azureturing/gpt-5.2
max_input_tokens: 400,000
max_output_tokens: 128,000
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions, v1/messages, v1/responses
SDK: OpenAI SDK / Anthropic SDK
输入: $1.75
输出: $14
缓存读: $0.17
Azure全球
上线: 2025-12-11
中国区
欧洲区
北美区
亚太区
升级版本,思考功能推荐使用 Response API
Azureturing/gpt-5.2-chat
max_input_tokens: 1,047,576
max_output_tokens: 32,768
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions, v1/messages, v1/responses
SDK: OpenAI SDK / Anthropic SDK
输入: $1.75
输出: $14
缓存读: $0.17
Azure 全球
上线: 2025-12-11
中国区
欧洲区
北美区
亚太区
升级版本,思考功能推荐使用 Response API
Azureturing/gpt-5.2-codex
max_input_tokens: 400,000
max_output_tokens: 128,000
输入:
输出:
工具: 支持
思考: 支持
API: v1/responses
SDK: OpenAI SDK
输入: $1.75
输出: $14
缓存读: $0.17
Azure 全球
上线: 2025-12-11
中国区
欧洲区
北美区
亚太区
仅支持 Response API
Azureturing/gpt-5.1
max_input_tokens: 400,000
max_output_tokens: 128,000
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions, v1/messages, v1/responses
SDK: OpenAI SDK / Anthropic SDK
输入: $1.25
输出: $10
缓存读: $0.12
Azure 全球
上线: 2025-11-13
中国区
欧洲区
北美区
亚太区
升级版本,思考功能推荐使用 Response API
Azureturing/gpt-5.1-chat
max_input_tokens: 1,047,576
max_output_tokens: 32,768
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions, v1/messages, v1/responses
SDK: OpenAI SDK / Anthropic SDK
输入: $1.25
输出: $10
缓存读: $0.12
Azure 全球
上线: 2025-11-13
中国区
欧洲区
北美区
亚太区
升级版本,思考功能推荐使用 Response API
Azureturing/gpt-5.1-codex
max_input_tokens: 400,000
max_output_tokens: 128,000
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions, v1/responses
SDK: OpenAI SDK
输入: $1.25
输出: $10
缓存读: $0.12
Azure 全球
上线: 2025-08-10
中国区
欧洲区
北美区
亚太区
思考功能推荐使用 Response API
Azureturing/gpt-5.1-codex-mini
max_input_tokens: 400,000
max_output_tokens: 128,000
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions, v1/responses
SDK: OpenAI SDK
输入: $0.25
输出: $2
缓存读: $0.03
Azure 全球
上线: 2025-08-10
中国区
欧洲区
北美区
亚太区
思考功能推荐使用 Response API
Azureturing/gpt-5
max_input_tokens: 400,000
max_output_tokens: 128,000
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions, v1/messages, v1/responses
SDK: OpenAI SDK / Anthropic SDK
输入: $1.25
输出: $10
缓存读: $0.12
Azure 全球
上线: 2025-08-10
中国区
欧洲区
北美区
亚太区
思考功能推荐使用 Response API
Azureturing/gpt-5-mini
max_input_tokens: 400,000
max_output_tokens: 128,000
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions, v1/messages, v1/responses
SDK: OpenAI SDK / Anthropic SDK
输入: $0.25
输出: $2
缓存读: $0.03
Azure 全球
上线: 2025-08-10
中国区
欧洲区
北美区
亚太区
思考功能推荐使用 Response API
Azureturing/gpt-5-nano
max_input_tokens: 400,000
max_output_tokens: 128,000
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions, v1/messages, v1/responses
SDK: OpenAI SDK / Anthropic SDK
输入: $0.05
输出: $0.4
缓存读: $0.01
Azure 全球
上线: 2025-08-10
中国区
欧洲区
北美区
亚太区
思考功能推荐使用 Response API
Azureturing/gpt-5-chat
max_input_tokens: 1,047,576
max_output_tokens: 32,768
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions, v1/messages, v1/responses
SDK: OpenAI SDK / Anthropic SDK
输入: $1.25
输出: $10
缓存读: $0.12
Azure 全球
上线: 2025-08-10
预计下线: 2026-04-15
中国区
欧洲区
北美区
亚太区
思考功能推荐使用 Response API
Azureturing/o3
max_input_tokens: 200,000
max_output_tokens: 100,000
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions, v1/messages, v1/responses
SDK: OpenAI SDK / Anthropic SDK
输入: $10
输出: $40
缓存读: $0.5
Azure 全球
上线: 2025-04-17
中国区
欧洲区
北美区
亚太区
思考模型,推荐使用 Response API
Azureturing/gpt-4.1
max_input_tokens: 1,024,000
max_output_tokens: 32,768
输入:
输出:
工具: 支持
API: v1/chat/completions, v1/messages, v1/responses
SDK: OpenAI SDK / Anthropic SDK
输入: $2
输出: $8
缓存读: $0.50
Azure 全球
上线: 2025-04-16
中国区
欧洲区
北美区
亚太区
Azureturing/o4-mini
max_input_tokens: 200,000
max_output_tokens: 100,000
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions, v1/messages, v1/responses
SDK: OpenAI SDK / Anthropic SDK
输入: $1.11
输出: $4.4
缓存读: $0.28
Azure 全球
上线: 2025-04-16
中国区
欧洲区
北美区
亚太区
思考模型,推荐使用 Response API
Azureturing/gpt-4.1-mini
max_input_tokens: 1,024,000
max_output_tokens: 32,768
输入:
输出:
工具: 支持
API: v1/chat/completions, v1/messages, v1/responses
SDK: OpenAI SDK / Anthropic SDK
输入: $0.4
输出: $1.6
缓存读: $0.10
Azure 全球
上线: 2025-04-14
中国区
欧洲区
北美区
亚太区
Azureturing/gpt-4.1-nano
max_input_tokens: 1,024,000
max_output_tokens: 32,768
输入:
输出:
工具: 支持
API: v1/chat/completions, v1/messages, v1/responses
SDK: OpenAI SDK / Anthropic SDK
输入: $0.1
输出: $0.4
缓存读: $0.03
Azure 全球
上线: 2025-04-14
中国区
欧洲区
北美区
亚太区
Azureturing/o3-mini
max_input_tokens: 200,000
max_output_tokens: 100,000
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions, v1/messages, v1/responses
SDK: OpenAI SDK / Anthropic SDK
输入: $1.11
输出: $4.4
缓存读: $0.55
Azure 全球
上线: 2025-01-31
中国区
欧洲区
北美区
亚太区
思考模型,推荐使用 Response API
Azureturing/gpt-4o-mini
输入:
输出:
工具: 支持
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: $0.15
输出: $0.6
缓存读: $0.07
Azure 全球
上线: 2024-07-19
预计下线: 2026-03-31
中国区
欧洲区
北美区
亚太区
Azureturing/gpt-4o
输入:
输出:
工具: 支持
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: $2.5
输出: $10
缓存读: $1.25
Azure 全球
上线: 2024-05-14
中国区
欧洲区
北美区
亚太区

Gemini

Gemini 模型负载说明

Gemini 系列模型基于 Google Cloud Vertex AI 共享配额运行,吞吐量无法保证,高并发场景下可能频繁触发 429 限流。不推荐在对稳定性有严格要求的生产环境中直接使用。 图灵平台提供 Retry 与 Fallback 作为工程化缓解手段,但无法根本解决共享配额问题,且 Fallback 切换模型后输出可能不一致。如需根本解决,需额外购买 Provisioned Throughput(预配吞吐量)。 详见:Gemini 429 限流与预配吞吐量

筛选11/20
厂商接口模型ID模型能力endpoint价格(每百万 Tokens)负载与上下线支持访问地区备注
Vertex AIturing/gemini-3.5-flash
max_input_tokens: 1,048,576
max_output_tokens: 65,535
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: $1.5
输出: $9
缓存读: $0.15
网页搜索: $14 / 1K
Vertex AI 共享配额
上线: 2026-05-19
中国区
欧洲区
北美区
亚太区
最新版本 支持思考模式 & 内置网页搜索
Vertex AIturing/gemini-3.1-pro-latest
max_input_tokens: 1,048,576
max_output_tokens: 65,536
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: $2
输出: $12
缓存读: $0.4
网页搜索: $14 / 1K
分阶梯收费:超过 200K 输入后 输入: $4 / 输出: $18
Vertex AI 共享配额
上线: 2026-02-19
中国区
欧洲区
北美区
亚太区
最新版本 支持思考模式(含 MEDIUM 级别)& 内置网页搜索
Vertex AIturing/gemini-3.1-flash-lite-latest
max_input_tokens: 1,048,576
max_output_tokens: 65,535
输入:
输出:
工具: 支持
思考: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: $0.25
输出: $1.5
网页搜索: $14 / 1K
Vertex AI 共享配额
上线: 2025-12-18
中国区
欧洲区
北美区
亚太区
最新版本 支持思考模式 & 内置网页搜索
Vertex AIturing/gemini-3.1-flash-image
max_input_tokens: 131,072
max_output_tokens: 32,768
输入:
输出:
工具: 支持
思考: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: $0.50
输出: $3(Text)/$60(Image)
网页搜索: $14 / 1K
Vertex AI 共享配额
上线: 2025-12-18
中国区
欧洲区
北美区
亚太区
最新版本 支持思考模式 & 输出图像
Vertex AIturing/gemini-3.1-flash-lite-image
max_input_tokens: 65,536
max_output_tokens: 4,096
输入:
输出:
工具: 不支持
思考: 支持
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: $0.25
输出: $1.5(Text)/$30(Image)
Vertex AI 共享配额
上线: 2026-07-01
中国区
欧洲区
北美区
亚太区
Nano Banana 2 Lite,轻量图像生成,输出分辨率最高 1K
Vertex AIturing/gemini-3-flash-latest
max_input_tokens: 1,048,576
max_output_tokens: 65,536
输入:
输出:
工具: 支持
思考: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: $0.5
输出: $3
网页搜索: $14 / 1K
Vertex AI 共享配额
上线: 2025-12-18
预计下线: 2026-06-15
中国区
欧洲区
北美区
亚太区
支持思考模式 & 内置网页搜索
Vertex AIturing/gemini-3-pro-image
max_input_tokens: 65,000
max_output_tokens: 32,000
输入:
输出:
工具: -
思考: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: $2
输出: $12(Text)/$120(Image)
网页搜索: $14 / 1K
阶梯收费
Vertex AI 共享配额
上线: 2025-11-19
中国区
欧洲区
北美区
亚太区
最新版本 支持思考模式
Vertex AIturing/gemini-2.5-flash-image
max_input_tokens: 32,768
max_output_tokens: 8,192
输入:
输出:
工具: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: $0.3
输出: $2.5(Text)/$30(Image)
网页搜索: $14 / 1K
Vertex AI 共享配额
上线: 2025-09-12
中国区
欧洲区
北美区
亚太区
-(Nano Banana)
Vertex AIturing/gemini-2.5-flash-latest
max_input_tokens: 1,048,576
max_output_tokens: 65,535
输入:
输出:
工具: 支持
思考: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: $0.30
输出: $2.5
网页搜索: $14 / 1K
Vertex AI 共享配额
上线: 2025-07-17
预计下线: 2026-06-15
中国区
欧洲区
北美区
亚太区
支持思考模式 & 内置网页搜索
Vertex AIturing/gemini-2.5-flash-lite-latest
max_input_tokens: 1,048,576
max_output_tokens: 65,535
输入:
输出:
工具: 支持
思考: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: $0.10
输出: $0.40
网页搜索: $14 / 1K
Vertex AI 共享配额
上线: 2025-07-17
预计下线: 2026-06-15
中国区
欧洲区
北美区
亚太区
支持思考模式 & 内置网页搜索
Vertex AIturing/gemini-2.5-pro
max_input_tokens: 131,072
max_output_tokens: 131,072
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: $1.25
输出: $10
缓存读: $0.25
网页搜索: $14 / 1K
分阶梯收费:超过 200K 输入后 输入: $2.5 / 输出: $15
Vertex AI 共享配额
上线: 2025-06-18
中国区
欧洲区
北美区
亚太区
支持思考模式 & 内置网页搜索

Claude

警告

由于 Anthropic 政策限制,Claude 系列模型随时可能不可用,建议仅在个人项目中试用。

筛选14/19
厂商接口模型ID模型能力endpoint价格(每百万 Tokens)负载与上下线支持访问地区备注
Anthropicturing/claude-sonnet-5
max_input_tokens: 1,000,000
max_output_tokens: 128,000
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: $2
输出: $10
缓存读: $0.2
缓存写 5m: $2.5
缓存写 1h: $4
网页搜索: $10 / 1K
促销价有效期至 2026-08-31;2026-09-01 起标准价为输入 $3 / 输出 $15 / 缓存读 $0.3 / 缓存写 $3.75(5m)、$6(1h)
Vertex AI(全球部署)
上线: 2026-07-01
中国区
欧洲区
北美区
亚太区
最新 Sonnet 模型,默认开启 adaptive 思考;不支持 enabled/budget_tokens,支持工具、显式缓存与联网搜索
Anthropicturing/claude-fable-5
max_input_tokens: 1,000,000
max_output_tokens: 128,000
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: $10
输出: $50
缓存读: $1
缓存写 5m: $12.5
缓存写 1h: $20
网页搜索: $10 / 1K
Vertex AI(全球部署)
中国区
欧洲区
北美区
亚太区
新一代 Claude 模型,adaptive 思考始终开启且不可禁用;支持工具、显式缓存与联网搜索;严禁用于模型蒸馏,违者图灵平台有权追究责任
Anthropicturing/claude-opus-4.8
max_input_tokens: 1,000,000
max_output_tokens: 128,000
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: $5
输出: $25
缓存读: $0.5
缓存写 5m: $6.25
缓存写 1h: $10
网页搜索: $10 / 1K
Vertex AI(全球部署)
上线: 2026-06-01
中国区
欧洲区
北美区
亚太区
支持工具,仅支持 adaptive 思考模式(默认关闭,需显式传 thinking.type=adaptive)
Anthropicturing/claude-opus-4.7
max_input_tokens: 1,000,000
max_output_tokens: 128,000
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: $5
输出: $25
缓存读: $0.5
缓存写 5m: $6.25
缓存写 1h: $10
网页搜索: $10 / 1K
Vertex AI(全球部署)
上线: 2026-04-15
中国区
欧洲区
北美区
亚太区
支持工具,仅支持 adaptive 思考模式(默认关闭,需显式传 thinking.type=adaptive)
Anthropicturing/claude-opus-4.6
max_input_tokens: 1,000,000
max_output_tokens: 128,000
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: $5
输出: $25
缓存读: $0.5
缓存写 5m: $6.25
缓存写 1h: $10
网页搜索: $10 / 1K
Vertex AI(全球部署)
上线: 2026-02-25
中国区
欧洲区
北美区
亚太区
支持工具,推荐使用 adaptive 思考模式
Anthropicturing/claude-sonnet-4.6
max_input_tokens: 1,000,000
max_output_tokens: 128,000
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: $3
输出: $15
缓存读: $0.3
缓存写 5m: $3.75
缓存写 1h: $6
网页搜索: $10 / 1K
Vertex AI(全球部署)
上线: 2026-02-25
中国区
欧洲区
北美区
亚太区
最新版本 支持工具
Anthropicturing/claude-haiku-4.5
max_input_tokens: 200,000
max_output_tokens: 64,000
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: $1
输出: $5
缓存读: $0.1
缓存写 5m: $1.25
缓存写 1h: $2
网页搜索: $10 / 1K
Vertex AI(全球部署)
上线: 2026-01-19
中国区
欧洲区
北美区
亚太区
支持工具
Anthropicturing/claude-opus-4.5
max_input_tokens: 200,000
max_output_tokens: 64,000
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: $5
输出: $25
缓存读: $0.5
缓存写 5m: $6.25
缓存写 1h: $10
网页搜索: $10 / 1K
Vertex AI(全球部署)
上线: 2026-01-19
中国区
欧洲区
北美区
亚太区
支持工具
Anthropicturing/claude-4.5-sonnet
max_input_tokens: 200,000
max_output_tokens: 64,000
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: $3
输出: $15
缓存读: $0.3
缓存写 5m: $3.75
缓存写 1h: $6
网页搜索: $10 / 1K
分阶梯收费:超过 200K 输入后 输入/输出/缓存 翻倍
Vertex AI(全球部署)
上线: 2025-09-29
中国区
欧洲区
北美区
亚太区
支持工具,分阶梯收费
Anthropicturing/claude-4.5-sonnet-reasoning
max_input_tokens: 200,000
max_output_tokens: 64,000
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: $3
输出: $15
缓存读: $0.3
缓存写 5m: $3.75
缓存写 1h: $6
网页搜索: $10 / 1K
分阶梯收费:超过 200K 输入后 输入/输出/缓存 翻倍
Vertex AI(全球部署)
上线: 2025-09-29
中国区
欧洲区
北美区
亚太区
支持工具,分阶梯收费
Anthropicturing/claude-4-sonnet-latest
max_input_tokens: 200,000
max_output_tokens: 64,000
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: $3
输出: $15
缓存读: $0.3
缓存写 5m: $3.75
缓存写 1h: $6
AWS Bedrock(美国、新加坡)
上线: 2025-05-14
中国区
欧洲区
北美区
亚太区
支持工具
Anthropicturing/claude-4-sonnet-reasoning-latest
max_input_tokens: 200,000
max_output_tokens: 64,000
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: $3
输出: $15
缓存读: $0.3
缓存写 5m: $3.75
缓存写 1h: $6
AWS Bedrock(美国、新加坡)
上线: 2025-05-14
中国区
欧洲区
北美区
亚太区
支持工具
Anthropicturing/claude-4-opus-latest
max_input_tokens: 200,000
max_output_tokens: 32,000
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: $15
输出: $75
缓存读: $1.5
缓存写 5m: $18.75
缓存写 1h: $30
AWS Bedrock(美国)
上线: 2025-05-14
中国区
欧洲区
北美区
亚太区
支持工具
Anthropicturing/claude-4-opus-reasoning-latest
max_input_tokens: 200,000
max_output_tokens: 32,000
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: $15
输出: $75
缓存读: $1.5
缓存写 5m: $18.75
缓存写 1h: $30
AWS Bedrock(美国)
上线: 2025-05-14
中国区
欧洲区
北美区
亚太区
支持工具

字节火山

筛选11/20
厂商接口模型ID模型能力endpoint价格(每百万 Tokens)负载与上下线支持访问地区备注
字节火山doubao-seed-2.1-pro
max_input_tokens: 262,144
max_output_tokens: 262,144
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
API: v1/chat/completions, v1/responses
SDK: OpenAI SDK
输入: ¥6
输出: ¥30
缓存读: ¥1.2
字节火山
上线: 2026-06-24
中国区Seed 2.1 旗舰版,支持视频理解
字节火山doubao-seed-2.1-turbo
max_input_tokens: 262,144
max_output_tokens: 262,144
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
API: v1/chat/completions, v1/responses
SDK: OpenAI SDK
输入: ¥3
输出: ¥15
缓存读: ¥0.6
字节火山
上线: 2026-06-24
中国区Seed 2.1 均衡版,支持视频理解 + GUI Agent
字节火山doubao-seed-2-0-pro-260215
max_input_tokens: 262,144
max_output_tokens: 131,072
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
API: v1/chat/completions, v1/responses
SDK: OpenAI SDK
字节火山
上线: 2026-02-25
中国区最新版本 Seed 2.0 旗舰版,支持视频理解
字节火山doubao-seed-2-0-lite-260215
max_input_tokens: 262,144
max_output_tokens: 131,072
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
API: v1/chat/completions, v1/responses
SDK: OpenAI SDK
字节火山
上线: 2026-02-25
中国区最新版本 Seed 2.0 中端版,支持视频理解
字节火山doubao-seed-2-0-mini-260215
max_input_tokens: 262,144
max_output_tokens: 131,072
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
API: v1/chat/completions, v1/responses
SDK: OpenAI SDK
字节火山
上线: 2026-02-25
中国区最新版本 Seed 2.0 轻量版,支持视频理解
字节火山doubao-seed-2-0-code-preview-260215
max_input_tokens: 262,144
max_output_tokens: 131,072
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
API: v1/chat/completions, v1/responses
SDK: OpenAI SDK
字节火山
上线: 2026-02-25
中国区代码预览版
字节火山doubao-seedream-3-0-t2i-250415
输入:
输出:
工具: 不支持
API: v1/chat/completions
SDK: OpenAI SDK
输入: ¥0.2591 per image
输出: ¥0.2591 per image
字节火山
上线: 2025-09-15
中国区
字节火山bytedance/deepseek-v3
输入:
输出:
工具: 不支持
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: ¥2
输出: ¥8
字节火山
上线: 2025-01-02
中国区不支持temperature/top_p/max_tokens等参数
字节火山doubao-pro-128k
输入:
输出:
工具: 支持
API: v1/chat/completions
SDK: OpenAI SDK
输入: ¥5
输出: ¥9
字节火山
上线: 2024-06-12
中国区
字节火山doubao-pro-32k
输入:
输出:
工具: 支持
API: v1/chat/completions, v1/responses
SDK: OpenAI SDK
输入: ¥0.8
输出: ¥2
字节火山
上线: 2024-06-12
中国区
字节火山doubao-pro-4k
输入:
输出:
工具: 支持
API: v1/chat/completions
SDK: OpenAI SDK
输入: ¥0.8
输出: ¥2
字节火山
上线: 2024-06-12
中国区

阿里 DashScope

筛选31/39
厂商接口模型ID模型能力endpoint价格(每百万 Tokens)负载与上下线支持访问地区备注
阿里DashScopeqwen3.7-plus
max_input_tokens: 991,000
max_output_tokens: 64,000
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
阿里云
上线: 2026-06-08
中国区高性价比版 3.7,视觉-语言(图像输入)
阿里DashScopeqwen3.7-max
max_input_tokens: 991,000
max_output_tokens: 64,000
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: ¥6
输出: ¥18
缓存读: ¥1.2
阿里云
上线: 2026-05-28
中国区旗舰版 3.7
阿里DashScopeqwen3.6-plus
max_input_tokens: 983,616
max_output_tokens: 65,536
输入:
输出:
工具: 支持
思考: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages, v1/responses
SDK: OpenAI SDK / Anthropic SDK
阿里云
上线: 2026-04-03
中国区稳定版,当前与 qwen3.6-plus-2026-04-02 能力相同
阿里DashScopeqwen3.6-flash
max_input_tokens: 983,616
max_output_tokens: 65,536
输入:
输出:
工具: 支持
思考: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages, v1/responses
SDK: OpenAI SDK / Anthropic SDK
阿里云
上线: 2026-04-23
中国区轻量版 3.6
阿里DashScopeqwen3.6-max
max_input_tokens: 229,376
max_output_tokens: 65,536
输入:
输出:
工具: 支持
思考: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
阿里云
上线: 2026-04-23
预计下线: 2026-09-08
中国区旗舰版 3.6
阿里DashScopeqwen3.5-plus
max_input_tokens: 983,616
max_output_tokens: 65,536
输入:
输出:
工具: 支持
思考: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages, v1/responses
SDK: OpenAI SDK / Anthropic SDK
阿里云
上线: 2026-02-25
中国区快照版本
阿里DashScopeqwen3.5-flash
max_input_tokens: 983,616
max_output_tokens: 65,536
输入:
输出:
工具: 支持
思考: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages, v1/responses
SDK: OpenAI SDK / Anthropic SDK
阿里云
上线: 2026-02-25
中国区快照版本
阿里DashScopeqwen3.5-397b-a17b
max_input_tokens: 258,048
max_output_tokens: 81,920
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions
SDK: OpenAI SDK
阿里云
上线: 2026-02-25
中国区开源版旗舰模型,默认开启思考模式
阿里DashScopeqwen3.5-122b-a10b
max_input_tokens: 258,048
max_output_tokens: 81,920
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions
SDK: OpenAI SDK
阿里云
上线: 2026-02-25
中国区开源版,默认开启思考模式
阿里DashScopeqwen3.5-27b
max_input_tokens: 258,048
max_output_tokens: 81,920
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions
SDK: OpenAI SDK
阿里云
上线: 2026-02-25
中国区开源版密集模型,默认开启思考模式
阿里DashScopeqwen3.5-35b-a3b
max_input_tokens: 258,048
max_output_tokens: 81,920
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions
SDK: OpenAI SDK
阿里云
上线: 2026-02-25
中国区开源版轻量MoE模型,默认开启思考模式
阿里DashScopeqwen3-max-preview
max_input_tokens: 262,144
max_output_tokens: 65,536
输入:
输出:
工具: 支持
思考: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions
SDK: OpenAI SDK
阿里云
上线: 2025-09-17
预计下线: 2026-09-08
中国区
阿里DashScopeqwen-plus-latest
max_input_tokens: 997,952
max_output_tokens: 32,768
输入:
输出:
工具: 支持
思考: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions
SDK: OpenAI SDK
阿里云
上线: 2025-09-17
中国区注意 默认开启思考模式,关闭请传入参数 "enable_thinking": False
阿里DashScopeqwen3-coder-plus
max_input_tokens: 1,000,000
max_output_tokens: 65,536
输入:
输出:
工具: 支持
API: v1/chat/completions
SDK: OpenAI SDK
阿里云
上线: 2025-09-15
预计下线: 2026-07-08
中国区
阿里DashScopeqwen3-coder-plus-2025-07-22
max_input_tokens: 1,000,000
max_output_tokens: 65,536
输入:
输出:
工具: 支持
API: v1/chat/completions
SDK: OpenAI SDK
阿里云
上线: 2025-09-15
预计下线: 2026-07-08
中国区
阿里DashScopeqwen3-235b-a22b-thinking-2507
max_input_tokens: 126,976
max_output_tokens: 32,768
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions
SDK: OpenAI SDK
输入: ¥2
输出: ¥20
阿里云
上线: 2025-09-15
预计下线: 2026-07-08
中国区
阿里DashScopeqwen3-30b-a3b-thinking-2507
max_input_tokens: 126,976
max_output_tokens: 32,768
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions
SDK: OpenAI SDK
输入: ¥0.75
输出: ¥7.5
阿里云
上线: 2025-09-15
预计下线: 2026-07-08
中国区
阿里DashScopeqwen3-vl-plus
max_input_tokens: 260,096
max_output_tokens: 32,768
输入:
输出:
工具: 支持
API: v1/chat/completions
SDK: OpenAI SDK
阿里云
上线: 2026-03-02
中国区
阿里DashScopeqwen3-vl-flash
max_input_tokens: 260,096
max_output_tokens: 32,768
输入:
输出:
工具: 支持
API: v1/chat/completions
SDK: OpenAI SDK
阿里云
上线: 2026-03-02
预计下线: 2026-09-08
中国区
阿里DashScopeqwen-flash
max_input_tokens: 997,952
max_output_tokens: 32,768
输入:
输出:
工具: 支持
思考: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions
SDK: OpenAI SDK
阿里云
上线: 2025-08-21
中国区
阿里DashScopeqwen3-235b-a22b
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions
SDK: OpenAI SDK
输入: ¥2
输出: ¥8
阿里云
上线: 2025-04-29
预计下线: 2026-07-08
中国区注意 不支持非流式,默认开启思考模式,关闭请传入参数 "enable_thinking": False
阿里DashScopeqwen3-32b
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions
SDK: OpenAI SDK
输入: ¥2
输出: ¥8
阿里云
上线: 2025-04-29
预计下线: 2026-07-08
中国区注意 不支持非流式,默认开启思考模式,关闭请传入参数 "enable_thinking": False
阿里DashScopeqwen3-30b-a3b
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions
SDK: OpenAI SDK
输入: ¥0.75
输出: ¥3
阿里云
上线: 2025-04-29
预计下线: 2026-07-08
中国区注意 不支持非流式,默认开启思考模式,关闭请传入参数 "enable_thinking": False
阿里DashScopeqwen3-14b
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions
SDK: OpenAI SDK
输入: ¥1
输出: ¥4
阿里云
上线: 2025-04-29
预计下线: 2026-07-08
中国区注意 不支持非流式,默认开启思考模式,关闭请传入参数 "enable_thinking": False
阿里DashScopeqwen3-8b
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions
SDK: OpenAI SDK
输入: ¥0.5
输出: ¥2
阿里云
上线: 2025-04-29
预计下线: 2026-07-08
中国区注意 不支持非流式,默认开启思考模式,关闭请传入参数 "enable_thinking": False
阿里DashScopeqwen-vl-max
输入:
输出:
工具: 不支持
API: v1/chat/completions
SDK: OpenAI SDK
输入: ¥1.6
输出: ¥4
阿里云
上线: 2025-04-22
预计下线: 2026-07-13
中国区
阿里DashScopeqwq-plus
输入:
输出:
工具: -
思考: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions
SDK: OpenAI SDK
输入: ¥1.6
输出: ¥4
阿里云
上线: 2025-04-16
预计下线: 2026-07-13
中国区
阿里DashScopeqwen-long
输入:
输出:
工具: 支持
API: v1/chat/completions
SDK: OpenAI SDK
输入: ¥0.5
输出: ¥2
阿里云
上线: 2024-07-05
中国区
阿里DashScopeqwen-turbo
输入:
输出:
工具: 支持
思考: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions
SDK: OpenAI SDK
输入: ¥0.3
输出: ¥0.6
阿里云
上线: 2024-07-01
预计下线: 2026-07-13
中国区
阿里DashScopeqwen-plus
输入:
输出:
工具: 支持
思考: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions
SDK: OpenAI SDK
阿里云
上线: 2024-07-01
中国区
阿里DashScopeqwen-max
输入:
输出:
工具: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions
SDK: OpenAI SDK
输入: ¥2.4
输出: ¥9.6
阿里云
上线: 2024-07-01
预计下线: 2026-07-13
中国区

Deepseek

筛选4/10
厂商接口模型ID模型能力endpoint价格(每百万 Tokens)负载与上下线支持访问地区备注
Deepseekdeepseek-v4-pro
max_input_tokens: 1,000,000
max_output_tokens: 393,216
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK
输入: ¥12
输出: ¥24
缓存读: ¥2.4
阿里云
上线: 2026-04-25
中国区
Deepseekdeepseek-v4-flash
max_input_tokens: 1,000,000
max_output_tokens: 393,216
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK
输入: ¥1
输出: ¥2
缓存读: ¥0.2
阿里云
上线: 2026-04-25
中国区
Deepseekturing/deepseek-v3-2
max_input_tokens: 64,000
max_output_tokens: 8,192
输入:
输出:
工具: 不支持
思考: 支持
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK
输入: ¥2
输出: ¥3
[0, 32] 输入: ¥2 输出: ¥3 / (32, 128] 输入: ¥4 输出: ¥6
火山引擎(中国)
上线: 2025-12-11
中国区
Deepseekturing/deepseek-r1
max_input_tokens: 64,000
max_output_tokens: 8,192
输入:
输出:
工具: 不支持
思考: 支持
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK
输入: ¥4
输出: ¥16
阿里、火山(中国)
上线: 2025-02-25
中国区

智谱

筛选5/16
厂商接口模型ID模型能力endpoint价格(每百万 Tokens)负载与上下线支持访问地区备注
智谱glm-5.2
max_input_tokens: 1,048,576
max_output_tokens: 131,072
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: ¥8
输出: ¥28
缓存读: ¥2
智谱
上线: 2026-06-17
中国区最新旗舰,1M 上下文
智谱glm-5.1
max_input_tokens: 204,800
max_output_tokens: 131,072
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
智谱
上线: 2026-04-09
中国区
智谱glm-5
max_input_tokens: 204,800
max_output_tokens: 131,072
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
内置工具: 🔍 网页搜索
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
智谱
上线: 2026-02-24
中国区
智谱glm-4.7
max_input_tokens: 204,800
max_output_tokens: 131,072
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
智谱
上线: 2025-12-23
中国区
智谱glm-4.6
max_input_tokens: 204,800
max_output_tokens: 131,072
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
智谱
上线: 2025-11-11
中国区

MiniMax

筛选10/11
厂商接口模型ID模型能力endpoint价格(每百万 Tokens)负载与上下线支持访问地区备注
MiniMaxminimax-m3
max_input_tokens: 1,048,576
max_output_tokens: 131,072
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: ¥2.1
输出: ¥8.4
缓存读: ¥0.42
限时 5 折;上下文 512K-1M 输入 ¥4.2 / 输出 ¥16.8 / 缓存读 ¥0.84
MiniMax
上线: 2026-06-17
中国区MiniMax M3
MiniMaxminimax-m2.7
max_input_tokens: 204,800
max_output_tokens: 131,072
输入:
输出:
工具: 支持
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: ¥2.1
输出: ¥8.4
阿里云
上线: 2026-03-23
中国区最新版本 M2.7
MiniMaxminimax-m2.5-highspeed
max_input_tokens: 204,800
max_output_tokens: 204,800
输入:
输出:
工具: 支持
API: v1/chat/completions
SDK: OpenAI SDK
输入: ¥4.2
输出: ¥16.8
MiniMax
上线: 2026-02-25
中国区
MiniMaxminimax-m2.5
max_input_tokens: 204,800
max_output_tokens: 204,800
输入:
输出:
工具: 支持
API: v1/chat/completions
SDK: OpenAI SDK
输入: ¥2.1
输出: ¥8.4
MiniMax
上线: 2026-02-25
中国区
MiniMaxabab5.5-chat
输入:
输出:
工具: 支持
API: v1/chat/completions
SDK: OpenAI SDK
输入: ¥15
输出: ¥15
MiniMax
上线: 2025-04-22
中国区
MiniMaxabab5.5s-chat
输入:
输出:
工具: 支持
API: v1/chat/completions
SDK: OpenAI SDK
输入: ¥5
输出: ¥5
MiniMax
上线: 2025-04-22
中国区
MiniMaxabab6-chat
输入:
输出:
工具: 支持
API: v1/chat/completions
SDK: OpenAI SDK
输入: ¥100
输出: ¥100
MiniMax
上线: 2025-04-22
中国区
MiniMaxabab6.5-chat
输入:
输出:
工具: 支持
API: v1/chat/completions
SDK: OpenAI SDK
输入: ¥30
输出: ¥30
MiniMax
上线: 2025-04-22
中国区
MiniMaxabab6.5s-chat
输入:
输出:
工具: 支持
API: v1/chat/completions
SDK: OpenAI SDK
输入: ¥1
输出: ¥1
MiniMax
上线: 2025-04-22
中国区
MiniMaxminimax-text-01
输入:
输出:
工具: 支持
API: v1/chat/completions
SDK: OpenAI SDK
输入: ¥1
输出: ¥1
MiniMax
上线: 2025-04-02
中国区

KIMI

筛选4/5
厂商接口模型ID模型能力endpoint价格(每百万 Tokens)负载与上下线支持访问地区备注
KIMIkimi-k2.7-code
max_input_tokens: 229,376
max_output_tokens: 16,384
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
API: v1/chat/completions
SDK: OpenAI SDK
输入: ¥6.5
输出: ¥27
缓存读: ¥1.3
缓存写 5m: ¥8.125
缓存写 1h: ¥0.65
阿里云
上线: 2026-06-17
中国区Kimi 代码模型,支持文本、图片与视频输入,适合编程、对话与 Agent 任务
KIMIkimi-k2.6
max_input_tokens: 229,376
max_output_tokens: 16,384
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: ¥6.5
输出: ¥27
缓存读: ¥1.3
缓存写 5m: ¥8.125
阿里云
上线: 2026-05-08
中国区最新版本
KIMIkimi-k2.5
max_input_tokens: 258,048
max_output_tokens: 32,768
输入:
输出:
工具: 支持
缓存: 支持
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: ¥4
输出: ¥21
阿里云
上线: 2026-03-02
中国区
KIMIturing/kimi-k2-thinking
max_input_tokens: 229,376
max_output_tokens: 16,384
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: ¥4
输出: ¥16
月之暗面
上线: 2025-11-17
预计下线: 2026-07-08
中国区

小米 MiMo

筛选1/1
厂商接口模型ID模型能力endpoint价格(每百万 Tokens)负载与上下线支持访问地区备注
Xiaomimimo-v2.5-pro
max_input_tokens: 1,000,000
max_output_tokens: 128,000
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
API: v1/chat/completions, v1/messages
SDK: OpenAI SDK / Anthropic SDK
输入: ¥7
输出: ¥21
缓存读: ¥1.4
阿里云
上线: 2026-05-28
中国区小米开源推理模型

Bedrock

筛选2/2
厂商接口模型ID模型能力endpoint价格(每百万 Tokens)负载与上下线支持访问地区备注
Bedrocknova-lite-v1
max_input_tokens: 290,000
max_output_tokens: 10,000
输入:
输出:
工具: 支持
API: v1/chat/completions
SDK: OpenAI SDK
输入: $0.06
输出: $0.24
AWS Bedrock(美国)
上线: 2025-08-21
中国区
欧洲区
北美区
亚太区
Bedrockturing/titan-nove-lite-v1
max_input_tokens: 290,000
max_output_tokens: 10,000
输入:
输出:
工具: 支持
API: v1/chat/completions
SDK: OpenAI SDK
输入: $0.06
输出: $0.24
AWS Bedrock(美国)
上线: 2025-08-21
中国区
欧洲区
北美区
亚太区

Grok

筛选4/4
厂商接口模型ID模型能力endpoint价格(每百万 Tokens)负载与上下线支持访问地区备注
xAIturing/grok-4.3
max_input_tokens: 1,000,000
max_output_tokens: 1,000,000
输入:
输出:
工具: 支持
思考: 支持
缓存: 支持
API: v1/chat/completions, v1/messages, v1/responses
SDK: OpenAI SDK / Anthropic SDK
输入: $1.25
输出: $2.5
缓存读: $0.2
xAI API
上线: 2026-05-28
中国区
欧洲区
北美区
亚太区
xAIturing/grok-4-0709
max_input_tokens: 256,000
max_output_tokens: 256,000
输入:
输出:
工具: 支持
API: v1/chat/completions, v1/messages, v1/responses
SDK: OpenAI SDK / Anthropic SDK
输入: $3
输出: $15
xAI API
上线: 2025-10-13
中国区
欧洲区
北美区
亚太区
xAIturing/grok-4-fast-non-reasoning
max_input_tokens: 2,000,000
max_output_tokens: 2,000,000
输入:
输出:
工具: 不支持
API: v1/chat/completions, v1/messages, v1/responses
SDK: OpenAI SDK / Anthropic SDK
输入: $0.2
输出: $0.5
xAI API
上线: 2025-10-13
中国区
欧洲区
北美区
亚太区
xAIturing/grok-4-fast-reasoning
max_input_tokens: 2,000,000
max_output_tokens: 2,000,000
输入:
输出:
工具: 支持
思考: 支持
API: v1/chat/completions, v1/messages, v1/responses
SDK: OpenAI SDK / Anthropic SDK
输入: $0.2
输出: $0.5
xAI API
上线: 2025-10-13
中国区
欧洲区
北美区
亚太区