模型选型指南

平台	说明
Chatbot Arena（LMSYS）	全球最权威的盲测排名，用户投票 + ELO 评分，支持按代码/数学/推理等维度筛选
OpenCompass 司南	国内最全面的大模型评测，上海人工智能实验室维护，中英文模型均覆盖

平台	说明
Artificial Analysis	专为 API 用户设计，对比质量/价格/速度/延迟，支持拖动权重直接给出最优选择
CompassArena 司南竞技场	中文场景盲测对比，与 OpenCompass 同一团队维护

平台	说明
LiveBench	自动化评测，题目定期刷新避免数据污染，覆盖数学/代码/推理/语言理解等维度
FlagEval 天秤	北京智源研究院维护，覆盖大语言模型和多模态模型的多维度评测

平台	说明
Open LLM Leaderboard（Hugging Face）	全球开源模型权威排名
SuperCLUE	老牌中文评测品牌，覆盖推理、知识、安全性、多轮对话等维度

信息

了解各模型详细参数、价格和接入方式，请访问模型列表。

按类型浏览​