数学竞赛(AIME)、代码生成、常识推理(MMLU)等领域表现出色

大语言模型竞技场,对比不同LLM模型性能,助力选择合适模型