阿里云大模型Qwen2.5问鼎OpenCompass评测榜为首个夺冠开源模型

近日，国内权威大模型评测榜平台司南（OpenCompass）公布其9月大语言模型测评榜单，阿里云通义千问开源模型Qwen2.5-72B-Instruct位列第一，领先Claude 3.5、GPT-4o等闭源模型，亦成为该评测榜首个夺冠的开源模型。

10月中，司南发布2024年9月榜单，Qwen2.5-72B以综合评分70.3分夺冠，首次超越Claude 3.5（68.9分）和GPT-4o（67.2分）等顶尖闭源模型。 Qwen2.5-72B-Instruct在此次榜单的多项能力测评中名列前茅。在代码能力方面，Qwen2.5-72B-Instruct以74.2分夺冠，不仅能准确完成代码编写，还能详细解释代码的功能和逻辑;在数学能力方面，Claude 3.5得分72.1，GPT-4o得分70.6，而Qwen2.5-72B-Instruct则获得77分成绩。

司南表示Qwen2.5-72B-Instruct以其优异的综合表现，问鼎9月榜单榜首位置，并称这是开源模型首次占据榜首，标志着开源社区在模型领域取得快速进展。

司南是由上海人工智能实验室研发的大模型评测体平台，国内外主流大模型包括OpenAI、谷歌、Meta、阿里巴巴、智谱AI、零一万物等主流的大模型均已加入评测，是国内具有影响力的第三方权威评测榜单。司南自建评测榜单每两月更新一次，综合评估商业API模型和开源模型在语言、推理、知识、代码、数学、指令跟随和智能体这七大能力维度下的十多项细分任务对主流商业API模型和开源模型进行全面评测分析。

在上个月举行的云栖大会上，阿里云发布其最新开源模型Qwen 2.5，在全球开源社区发布超过100个开源模型，开源模型参数规模从5亿到720亿不等，其知识、数学和编码能力均有提升并能支持超过29种语言，可满足端侧及云部署的需求，支持AI于汽车、游戏、科学研究等各领域的广泛应用。

自2023年4月推出，Qwen模型在Hugging Face及阿里云旗下AI开源社区ModelScope 等平台的下载量已超过4,000万次。截至9月底，全球开发者基于Qwen系列二次开发的衍生模型数量也已突破7.43万，超越Llama的7.28万，成为全球最大的开源模型群。

Tags: 企业活动

阿里云大模型Qwen2.5问鼎OpenCompass评测榜为首个夺冠开源模型

其他资讯

腾讯混元Hy3正式发布：Agent能力显著提升，产品深度融合

腾讯通过“碳寻计划2.0”催化资金支持新一代减碳创新者，持续推动气候目标落实

HarmonyOS 7 开发者 Beta 正式启动，全场景智能操作系统再升级

联想集团与天津市政府重磅签约联手打造新一代AI算力产品研发制造中心

华为发表韬(τ)定律，实现晶体管密度与系统性能突破

阿里迈向AI商业化云外部收入加速增长40%

霍尼韦尔发布“操作导航”，引领流程行业迈向自主运营新阶段

爱立信Ericsson Forum路演中国首站启动

上海波音启用全新机库

HarmonyOS 7 开发者 Beta 正式启动，全场景智能操作系统再升级

腾讯通过“碳寻计划2.0”催化资金支持新一代减碳创新者，持续推动气候目标落实

Fiery与北京至一中和科技有限公司签署战略合作协议全球首台890mm宽幅高速连续纸POD喷墨数字印刷系统落地跨国技术协同引领行业创新变革

华夏凯德商业REIT正式获批

TÜV南德携手招商车研赋能中国汽车全球化发展

松下释放加码中国市场重磅信号，全球高层亲临京东MALL

AED进园区：安博中国携手海尔施，共建园区生命防线

联系我们 | CONTACT US

阿里云大模型Qwen2.5问鼎OpenCompass评测榜 为首个夺冠开源模型

其他资讯

联 系 我 们 | CONTACT US

阿里云大模型Qwen2.5问鼎OpenCompass评测榜为首个夺冠开源模型

联系我们 | CONTACT US