跳到主要内容

Rerank API 使用指南

图灵平台的 Rerank(重排序)模型可以根据查询语句对一组文档进行相关性排序,广泛用于 RAG(检索增强生成)、搜索引擎结果优化等场景。

注意:

  • Rerank API 兼容 Cohere Rerank 格式
  • 支持中文、英语、西班牙语、法语、葡萄牙语、日语、韩语、德语、俄罗斯语、印尼语等 100+ 语种
  • 支持通过 top_n 参数控制返回的文档数量
  • 返回结果按相关性得分从高到低排序
  • 可用模型请查看 模型列表

请求参数

参数类型必填说明
modelstring模型 ID,如 qwen3-rerank
querystring搜索查询语句
documentslist[string]待排序的文档列表
top_nint返回排名前 N 的文档,默认返回全部
return_documentsbool是否在结果中返回文档内容
rank_fieldslist[string]指定用于排序的字段(文档为 dict 时使用)
max_chunks_per_docint每个文档的最大分块数
max_tokens_per_docint每个文档的最大 token 数

响应格式

字段类型说明
idstring请求 ID
resultslist排序后的结果列表
results[].indexint文档在原始列表中的索引
results[].relevance_scorefloat文档的相关性得分
results[].documentobject文档内容(当 return_documents=true 时返回)
metaobject元数据信息(包含 token 用量等)

CURL

curl $TURING_BASE_URL/rerank \
-H "Authorization: Bearer $TURING_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3-rerank",
"query": "什么是文本排序模型",
"documents": [
"文本排序模型广泛用于搜索引擎和推荐系统中,它们根据文本相关性对候选文本进行排序",
"量子计算是计算科学的一个前沿领域",
"预训练语言模型的发展给文本排序模型带来了新的进展"
],
"top_n": 2
}'

响应示例

{
"id": "rerank-xxxxx",
"results": [
{
"index": 0,
"relevance_score": 0.98,
"document": {
"text": "文本排序模型广泛用于搜索引擎和推荐系统中,它们根据文本相关性对候选文本进行排序"
}
},
{
"index": 2,
"relevance_score": 0.85,
"document": {
"text": "预训练语言模型的发展给文本排序模型带来了新的进展"
}
}
],
"meta": {
"billed_units": {
"total_tokens": 128
}
}
}

See also