Rerank API 使用指南

图灵平台的 Rerank（重排序）模型可以根据查询语句对一组文档进行相关性排序，广泛用于 RAG（检索增强生成）、搜索引擎结果优化等场景。

注意：

Rerank API 兼容 Cohere Rerank 格式
支持中文、英语、西班牙语、法语、葡萄牙语、日语、韩语、德语、俄罗斯语、印尼语等 100+ 语种
支持通过 top_n 参数控制返回的文档数量
返回结果按相关性得分从高到低排序
可用模型请查看模型列表

请求参数

参数	类型	必填	说明
`model`	string	是	模型 ID，如 `qwen3-rerank`
`query`	string	是	搜索查询语句
`documents`	list[string]	是	待排序的文档列表
`top_n`	int	否	返回排名前 N 的文档，默认返回全部
`return_documents`	bool	否	是否在结果中返回文档内容
`rank_fields`	list[string]	否	指定用于排序的字段（文档为 dict 时使用）
`max_chunks_per_doc`	int	否	每个文档的最大分块数
`max_tokens_per_doc`	int	否	每个文档的最大 token 数

响应格式

字段	类型	说明
`id`	string	请求 ID
`results`	list	排序后的结果列表
`results[].index`	int	文档在原始列表中的索引
`results[].relevance_score`	float	文档的相关性得分
`results[].document`	object	文档内容（当 `return_documents=true` 时返回）
`meta`	object	元数据信息（包含 token 用量等）

CURL

curl $TURING_BASE_URL/rerank \
  -H "Authorization: Bearer $TURING_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3-rerank",
    "query": "什么是文本排序模型",
    "documents": [
      "文本排序模型广泛用于搜索引擎和推荐系统中，它们根据文本相关性对候选文本进行排序",
      "量子计算是计算科学的一个前沿领域",
      "预训练语言模型的发展给文本排序模型带来了新的进展"
    ],
    "top_n": 2
  }'

响应示例

{
  "id": "rerank-xxxxx",
  "results": [
    {
      "index": 0,
      "relevance_score": 0.98,
      "document": {
        "text": "文本排序模型广泛用于搜索引擎和推荐系统中，它们根据文本相关性对候选文本进行排序"
      }
    },
    {
      "index": 2,
      "relevance_score": 0.85,
      "document": {
        "text": "预训练语言模型的发展给文本排序模型带来了新的进展"
      }
    }
  ],
  "meta": {
    "billed_units": {
      "total_tokens": 128
    }
  }
}

请求参数​

响应格式​

CURL​

响应示例​

See also​

请求参数

响应格式

CURL

响应示例

See also