跳到主要内容

Chat Completions 接口

OpenAI 兼容的 /v1/chat/completions 是图灵平台最主要的模型调用入口。所有主流厂商(OpenAI、Claude、Gemini、Qwen、DeepSeek、智谱、字节、KIMI、MiniMax、Bedrock 等)都可以通过这一个协议调用,只需切换 model 字段。

完整接口参考 + Try-It

参数 schema、响应 schema、多语言代码示例、交互式 Try-It:Create chat completion →

本页聚焦使用场景与跨厂商的能力差异,不重复 schema 字段字典。

概览

项目说明
端点POST /api/v1/chat/completions
协议兼容OpenAI Chat Completions API
主要用途对话 / 函数调用 / 工具使用 / 多模态输入 / 流式输出 / 思考模式 / 联网搜索
支持模型模型价格清单 为准,可按厂商段落查看可用型号
计费按 token 实时计量,见 计费与用量

什么时候选这个接口

  • 跨厂商统一入口:一份代码要在 Claude / GPT / Gemini 之间切换,这是首选。
  • 需要 OpenAI 生态工具:LangChain、LlamaIndex、Autogen 等默认走 /v1/chat/completions
  • 已有 OpenAI SDK 代码:仅换 api_key / base_url 两行即可接入。

其它选择:

能力集成

下面几段只演示 概念 —— 即"这个能力在请求里长什么样"。完整的请求体 schema / 响应 schema / 多语言样本都在 /api/create-chat-completion

视觉(图像输入)

多模态模型(GPT-4o / Claude / Gemini / Qwen-VL 等)接受 image_url 或 base64 image content:

curl $TURING_BASE_URL/chat/completions \
-H "Authorization: Bearer $TURING_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "turing/gpt-5.5",
"messages": [{
"role": "user",
"content": [
{"type": "text", "text": "描述这张图"},
{"type": "image_url", "image_url": {"url": "https://.../image.jpg"}}
]
}]
}'

思考模式 / 推理

  • OpenAI / Azure 推理模型(GPT-5、o1/o3/o4):加 reasoning_effort: "low"|"medium"|"high"
  • Claude 4.6+ / 5.x:用 extra_body={"thinking": {"type": "adaptive"}, "output_config": {"effort": "high"}};Opus 4.7/4.8、Sonnet 5 不支持 enabled / budget_tokens
  • Qwen 思考版 / DeepSeek R1:自动启用,无需开关

详见 思考模型配置

联网搜索

通过 tools / extra_body 按厂商协议传入。三家写法不同:

  • Qwen:extra_body={"enable_search": True}
  • Gemini:tools: [{"googleSearch": {}}]
  • Claude:tools: [{"type": "web_search_20250305", "name": "web_search", "max_uses": 3}]

详见 模型内置 Web Search

Prompt 缓存

  • Claude:需要显式 cache_control,见 Prompt 缓存 (Claude)
  • OpenAI GPT-4o / GPT-5:自动缓存,无需参数
  • 命中数量在 usage.prompt_tokens_details.cached_tokens,按对应缓存读单价计费

厂商专有参数

OpenAI SDK 的 extra_body 用于传递任何厂商专有、非标准的字段:

curl $TURING_BASE_URL/chat/completions \
-H "Authorization: Bearer $TURING_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen-max-latest",
"messages": [...],
"enable_search": true,
"thinking": {"type": "adaptive"},
"cache_control": {"type": "ephemeral"}
}'

cURL 直接写在 body 顶层;Python SDK 用 extra_body={...};Java SDK 用 putAdditionalBodyProperty;TypeScript SDK 需要 @ts-expect-erroras any 绕过类型。

turing_options

图灵平台在 OpenAI 请求体上扩展的 turing_options 字段(放在请求体顶层,不是 extra_body 里),用于配置超时、重试、fallback 等平台行为。字段定义、默认值、取值范围见 超时、重试与 Fallback

See also