Rerank API 使用指南
图灵平台的 Rerank(重排序)模型可以根据查询语句对一组文档进行相关性排序,广泛用于 RAG(检索增强生成)、搜索引擎结果优化等场景。
注意:
- Rerank API 兼容 Cohere Rerank 格式
- 支持中文、英语、西班牙语、法语、葡萄牙语、日语、韩语、德语、俄罗斯语、印尼语等 100+ 语种
- 支持通过
top_n参数控制返回的文档数量 - 返回结果按相关性得分从高到低排序
- 可用模型请查看 模型列表
请求参数
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
model | string | 是 | 模型 ID,如 qwen3-rerank |
query | string | 是 | 搜索查询语句 |
documents | list[string] | 是 | 待排序的文档列表 |
top_n | int | 否 | 返回排名前 N 的文档,默认返回全部 |
return_documents | bool | 否 | 是否在结果中返回文档内容 |
rank_fields | list[string] | 否 | 指定用于排序的字段(文档为 dict 时使用) |
max_chunks_per_doc | int | 否 | 每个文档的最大分块数 |
max_tokens_per_doc | int | 否 | 每个文档的最大 token 数 |
响应格式
| 字段 | 类型 | 说明 |
|---|---|---|
id | string | 请求 ID |
results | list | 排序后的结果列表 |
results[].index | int | 文档在原始列表中的索引 |
results[].relevance_score | float | 文档的相关性得分 |
results[].document | object | 文档内容(当 return_documents=true 时返回) |
meta | object | 元数据信息(包含 token 用量等) |
CURL
curl $TURING_BASE_URL/rerank \
-H "Authorization: Bearer $TURING_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3-rerank",
"query": "什么是文本排序模型",
"documents": [
"文本排序模型广泛用于搜索引擎和推荐系统中,它们根据文本相关性对候选文本进行排序",
"量子计算是计算科学的一个前沿领域",
"预训练语言模型的发展给文本排序模型带来了新的进展"
],
"top_n": 2
}'
响应示例
{
"id": "rerank-xxxxx",
"results": [
{
"index": 0,
"relevance_score": 0.98,
"document": {
"text": "文本排序模型广泛用于搜索引擎和推荐系统中,它们根据文本相关性对候选文本进行排序"
}
},
{
"index": 2,
"relevance_score": 0.85,
"document": {
"text": "预训练语言模型的发展给文本排序模型带来了新的进展"
}
}
],
"meta": {
"billed_units": {
"total_tokens": 128
}
}
}
See also
- API 参考 → Rerank — 完整请求 / 响应 schema,含 Try-It 与多语言样例(cURL / Python / Node.js / Java)
- 模型列表(Rerank) — 可用模型与单价