Chat Completions 接口
OpenAI 兼容的 /v1/chat/completions 是图灵平台最主要的模型调用入口。所有主流厂商(OpenAI、Claude、Gemini、Qwen、DeepSeek、智谱、字节、KIMI、MiniMax、Bedrock 等)都可以通过这一个协议调用,只需切换 model 字段。
参数 schema、响应 schema、多语言代码示例、交互式 Try-It:Create chat completion →
本页聚焦使用场景与跨厂商的能力差异,不重复 schema 字段字典。
概览
| 项目 | 说明 |
|---|---|
| 端点 | POST /api/v1/chat/completions |
| 协议兼容 | OpenAI Chat Completions API |
| 主要用途 | 对话 / 函数调用 / 工具使用 / 多模态输入 / 流式输出 / 思考模式 / 联网搜索 |
| 支持模型 | 以 模型价格清单 为准,可按厂商段落查看可用型号 |
| 计费 | 按 token 实时计量,见 计费与用量 |
什么时候选这个接口
- 跨厂商统一入口:一份代码要在 Claude / GPT / Gemini 之间切换,这是首选。
- 需要 OpenAI 生态工具:LangChain、LlamaIndex、Autogen 等默认走
/v1/chat/completions。 - 已有 OpenAI SDK 代码:仅换
api_key/base_url两行即可接入。
其它选择:
- Claude 专用能力(
cache_control精细缓存、web_search_20250305原生工具、thinking block 结构)→ Anthropic Messages 接口 - GPT-5 的有状态 reasoning / MCP connector → OpenAI Response API
能力集成
下面几段只演示 概念 —— 即"这个能力在请求里长什么样"。完整的请求体 schema / 响应 schema / 多语言样本都在 /api/create-chat-completion。
视觉(图像输入)
多模态模型(GPT-4o / Claude / Gemini / Qwen-VL 等)接受 image_url 或 base64 image content:
curl $TURING_BASE_URL/chat/completions \
-H "Authorization: Bearer $TURING_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "turing/gpt-5.5",
"messages": [{
"role": "user",
"content": [
{"type": "text", "text": "描述这张图"},
{"type": "image_url", "image_url": {"url": "https://.../image.jpg"}}
]
}]
}'
思考模式 / 推理
- OpenAI / Azure 推理模型(GPT-5、o1/o3/o4):加
reasoning_effort: "low"|"medium"|"high" - Claude 4.6+ / 5.x:用
extra_body={"thinking": {"type": "adaptive"}, "output_config": {"effort": "high"}};Opus 4.7/4.8、Sonnet 5 不支持enabled/budget_tokens - Qwen 思考版 / DeepSeek R1:自动启用,无需开关
详见 思考模型配置。
联网搜索
通过 tools / extra_body 按厂商协议传入。三家写法不同:
- Qwen:
extra_body={"enable_search": True} - Gemini:
tools: [{"googleSearch": {}}] - Claude:
tools: [{"type": "web_search_20250305", "name": "web_search", "max_uses": 3}]
详见 模型内置 Web Search。
Prompt 缓存
- Claude:需要显式
cache_control,见 Prompt 缓存 (Claude) - OpenAI GPT-4o / GPT-5:自动缓存,无需参数
- 命中数量在
usage.prompt_tokens_details.cached_tokens,按对应缓存读单价计费
厂商专有参数
OpenAI SDK 的 extra_body 用于传递任何厂商专有、非标准的字段:
curl $TURING_BASE_URL/chat/completions \
-H "Authorization: Bearer $TURING_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen-max-latest",
"messages": [...],
"enable_search": true,
"thinking": {"type": "adaptive"},
"cache_control": {"type": "ephemeral"}
}'
cURL 直接写在 body 顶层;Python SDK 用 extra_body={...};Java SDK 用 putAdditionalBodyProperty;TypeScript SDK 需要 @ts-expect-error 或 as any 绕过类型。
turing_options
图灵平台在 OpenAI 请求体上扩展的 turing_options 字段(放在请求体顶层,不是 extra_body 里),用于配置超时、重试、fallback 等平台行为。字段定义、默认值、取值范围见 超时、重试与 Fallback。
See also
- /api/create-chat-completion — 完整 schema + Try-It
- 计费与用量 —
usage/service_usages字段含义、对账接口 - Anthropic Messages 接口 — 如果你倾向 Claude 原生协议
- OpenAI Response API — GPT-5 系列支持的新响应协议
- 思考模型配置 —
reasoning_effort/thinking字段 - 模型内置 Web Search — 各厂商的联网搜索参数
- Prompt 缓存 (Claude) —
cache_control用法 - 模型价格清单 — 每个模型的具体单价