本报讯 (记者袁传玺)7月10日,中文大模型测评基准SuperCLUE发布2024上半年报告,披露针对国内外33个大模型的综合测评结果。阿里通义千问的开源模型Qwen2-72B成为排名第一的中国大模型,SuperCLUE报告认为通义千问“超过众多国内外闭源模型”“引领全球的开源生态”。该报告针对国内外33个大模型的6月份版本进行测评。从代表通用能力的一级总分来看,OpenAI的GPT-4o以81分高居榜首,Claude-3.5-Sonnet与通义千问开源模型Qwen2-72B-Instruct并列第二,得分均为77。
报告同时公布了端侧小模型测评榜单,通义千问70亿参数开源模型Qwen2-7B排名第一,展现了更小尺寸模型的极致性能。报告认为,2024年上半年端侧小模型进展迅速,极大提升了落地的可行性。
据悉,Qwen2是阿里在今年6月份推出的通义千问第二代开源模型,已先后登顶国内外多个权威榜单,引领中国开源模型强势崛起。Qwen系列开源模型下载量已经突破2000万次。
SuperCLUE报告点评:“综合来看,Qwen2-72B整体能力不俗,引领全球的开源生态,是一个非常有竞争力的通用开源大模型,可应用于推理、数理分析、信息处理或相对专业复杂场景,重点推荐应用于工业、金融、医疗、汽车等垂直专业场景。”
(编辑 王江浩)