华业网
  • 首 页
  • 可 持 续 发 展
  • 投 资
  • 市 场
  • 合 作
  • 创 新
  • 人 事
  • 观 点
No Result
View All Result
  • 首 页
  • 可 持 续 发 展
  • 投 资
  • 市 场
  • 合 作
  • 创 新
  • 人 事
  • 观 点
No Result
View All Result
No Result
View All Result
Home 全行业 信息技术

阿里云发布开源模型Qwen2系列 增强安全性对齐及多语言能力

by Thomas Chang
2024年6月12日
A A

阿里云最近发布其最新通义千问(Qwen)大型语言模型Qwen2系列,不仅性能表现突出,改善安全性对齐,并在训练数据中增加了27种语言相关的高质量数据,提升了模型的多语言能力。

Qwen2系列上线不久后,便在业内权威开源评测榜单Hugging Face的开放LLM排行榜上名列第一。 通义千问开源模型拥有5亿到1,100亿参数的多种尺寸,已在Hugging Face和Github等平台上获得超过700万次下载量。

此次发布的Qwen2系列包含5个尺寸的预训练及指令微调模型,Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B,其中Qwen2-57B-A14B为混合专家模型(MoE)。 Qwen2以增强的性能和多语言能力为特色,展示了与人类价值观更好的对齐,使其更接近有用、诚实和安全的AI。

作为对开源社区的贡献,Qwen2系列模型均已开源,在其AI模型社区ModelScope(魔搭)和协作AI平台Hugging Face上供商业或研究目的使用。

阿里云首席技术官周靖人表示,「坚持开源开放是阿里云的重要策略,我们希望打造一朵AI时代最开放的云,让算力更普惠、让AI更普及。」

多语言能力及长文本支持

通过利用阿里云的优化训练方法,Qwen2-72B在语言理解、语言生成、多语言能力、编码、数学、推理等多个方面的15个标准测试中胜过其他领先的开源模型。 此外,Qwen2-72B增大了上下文长度支持,最高达到128K tokens。

为了增强其多语言能力,除了原本具备的中英文能力,Qwen 2的训练新增了27种语言覆盖亚洲、欧洲、中东地区,例如日文、韩文,越南语、印尼语、泰语、马来语、他加禄语、德语、法语、意大利语、阿拉伯语等。

除此之外,还为不同的Qwen2模型应用了群组查询注意力(Grouped-query attention, GQA)技术,以优化计算效率与模型性能之间的平衡,在模型推理过程中提升速度并减少内存使用。

负责任的AI

值得注意的是,通过后训练,Qwen2模型的输出在诸如MT-bench这样的基准测试中展示了与人类价值观更好的对齐,这是评估聊天机器人多轮对话和遵循指令能力的多轮问题集,这两个方面是人类偏好的两个关键要素。

通过纳入人类反馈以更好地与人类价值观对齐,这些模型在安全性和责任方面表现良好,能够应对与非法活动、欺诈、色情和隐私侵犯相关的多语言不安全查询,以防止模型的滥用。 在小模型方面,Qwen2-7B也在包括代码在内的多项基准测试中超越了其它相似尺寸的先进模型。

深入探索新兴技术主题

阿里云的Qwen2模型系列的推出和表现再次证明其在AI领域的领导地位,特别是在开放源代码的大型语言模型方面。 通过加强性能、多语言能力和安全性的对齐,Qwen2旨在推动AI技术的进步,同时确保其应用符合人类价值观和伦理标准。 随着AI技术的快速发展,像Qwen2这样的模型在推进技术创新的同时,也提醒我们需关注其在社会中的应用和影响。 阿里云对开源社区的贡献,包括使这些先进的模型可用于商业和研究目的,进一步展示了公司致力于推广AI知识和技术的开放获取,旨在激发全球范围内的创新和发展。

Tags: 创新与研发

其他资讯

信息技术

英特尔助力阿里云推出多款云实例与存储方案,共筑AI时代云端算力基石

2025年9月30日
信息技术

以创新引领功率未来,英飞凌亮相PCIM Asia 2025

2025年9月29日
信息技术

率先实现后量子安全算法技术落地上车!小鹏汽车与阿里云签署后量子加密安全合作协议

2025年9月26日
信息技术

阿里云公布国际扩展计划 为新一代AI创新赋能

2025年9月25日
信息技术

美的集团与华为签署战略合作协议,共拓AI领域创新生态

2025年9月21日
信息技术

华为发布全球最强算力超节点和集群

2025年9月19日
<简体> <繁體>

强生医疗科技携手行业专家和丁香园共同启动“房颤百问百答答案书”项目 助力提升房颤诊疗理念规范化

2025年10月18日

...

霍尼韦尔与LS电气宣布达成全球合作伙伴关系 助力加速数据中心和电池储能系统创新

2025年10月15日

...

巴斯夫杉杉与中国燃气携手打造大型智能储能电站投运,推动区域能源结构优化升级

2025年10月29日

...

波音公司任命陆一鸣为波音中国总裁

2025年10月27日

...

中兴通讯联合菜鸟打造长沙超级智能工厂,获国家智能制造最高等级认证

2025年10月11日

...

巴斯夫与中国石化达成化工产品碳足迹核算方法学互认,一致标准赋能行业绿色转型

2025年10月24日

...

美敦力在华首个数字化医疗创新基地正式落地北京!

2025年10月26日

...

NBA中国与阿里云宣布达成多年合作焕新球迷体验

2025年10月10日

...

前沿技术护航 π-HuB 计划,深化合作构建全球科研新生态 赛默飞亮相国际蛋白质组学盛会

2025年10月15日

...

Honda中国与东风集团股份合作开展 氢燃料电池商用车社会示范运行

2025年10月23日

...

华业网 (Greater China Business) 致力于促进全球跨国公司、机构在华贸易、投资与业务发展;促进大中华区业务交流与合作;关注最新企业动态和行业趋势;分享经营与管理经验;传播卓越理念,为各方在华取得商业成功,促进可持续发展、友好交流贡献力量。

联 系 我 们 | CONTACT US

商务合作联系:  partnership#apac-business.com

媒体资讯联系:  editor#apac-business.com

人力资源联系:  hr#apac-business.com

* (替换# 为 @)

www.apac-business.com

  • 首 页
  • 可 持 续 发 展
  • 投 资
  • 市 场
  • 合 作
  • 创 新
  • 人 事
  • 观 点

Copyright © 华业网 Greater China Business | 沪ICP备2022016631号-2

No Result
View All Result
  • 首 页
  • 可 持 续 发 展
  • 投 资
  • 市 场
  • 合 作
  • 创 新
  • 人 事
  • 观 点

Copyright © 华业网 Greater China Business | 沪ICP备2022016631号-2

沪公网安备 31011402010150号