SuperCLUE

一个专注于中文大语言模型（LLM）综合性评测的权威基准平台

SuperCLUE 的官方网站一个专注于中文大语言模型（LLM）综合性评测的权威基准平台。

SuperCLUE（Super Chinese Language Understanding Evaluation）是 CLUE 中文语言理解测评基准在通用大模型时代的重大升级版本，被公认为目前最全面、最具权威性的中文大模型评测榜单之一。

它主要解决的问题：

平台通常从多个维度全面评估模型，覆盖大约 70+ 项能力，主要包括以下四大象限：

评测方式结合了：

总榜 & 分榜：中文大模型综合排行榜、各细分能力榜单
国内外模型对比：同时收录国内外主流模型（如 GPT-4o、Claude、Gemini、文心一言、通义千问、DeepSeek、Kimi、豆包、GLM、Qwen、Yi、Moonshot 等）
历史榜单：可查看 2023、2024、2025 等年度报告与月度/季度更新
媒体生成榜：部分时期还会单独评测 AI 写作、图片生成、中文多模态等