华业网
  • 首 页
  • 可 持 续 发 展
  • 投 资
  • 市 场
  • 合 作
  • 创 新
  • 人 事
  • 观 点
No Result
View All Result
  • 首 页
  • 可 持 续 发 展
  • 投 资
  • 市 场
  • 合 作
  • 创 新
  • 人 事
  • 观 点
No Result
View All Result
No Result
View All Result
Home 全行业 信息技术

阿里云开源多种参数及多模态大语言模型 持续贡献开源社区

by Thomas Chang
2023年12月6日
A A

阿里云近日宣布开源通义千问720亿参数版本Qwen-72B和18亿参数版本Qwen-1.8B,并在其开源人工智能(AI)模型社区ModelScope(魔搭)和AI协作平台Hugging Face上架。

此外,阿里云开源了更多模态的大语言模型,包括预训练的音频理解模型Qwen-Audio及其会话微调版本Qwen-Audio-Chat,可供研究与商业用途使用。

截至目前,阿里云开源了多种参数规模的大语言模型,包括18亿、70亿、140亿、720亿,并开源了具有音频和视觉理解功能的多模态大语言模型,积极贡献开源生态和社群。

阿里云首席技术官周靖人表示:开源生态对推动大语言模型发展和AI应用落地至关重要。 我们希望成为最开放的云,让每个人都能享受生成式AI的能力。 为此,我们将继续分享前沿技术技术,与合作伙伴共同促进开源社区的发展。”

Qwen-72B在十项基准测试表现均为最优

基于超过3万亿个tokens预训练,Qwen-72B在十项基准测试中的表现优于其他主流开源模型,其中包括衡量模型多任务准确性的大规模多任务语言理解(MMLU)基准测试、测试代码生成能力的HumanEval基准测试以及算术问题基准测试GSM8K等。

阿里云开源多种参数及多模态大语言模型 持续贡献开源社区

Qwen-72B在十项基准测试中的表现优于其他主流开源模型

该模型还能熟练地处理各种复杂的任务,包括角色扮演和语言风格转换,即大语言模型能扮演特定角色,并生成与该人物相符并与上下文更相关的回复。 这些功能在个性化聊天机器人等AI应用中十分重要。

企业和科研机构可以访问Qwen-72B模型的代码、模型权重和文档,并免费用于研究目的。 对于商业用途,月活跃用户少于1亿的公司可以免费使用模型。

此外,阿里云还宣布开源可在边缘设备运行的18亿参数大语言模型。 这种轻量大语言模型可以在计算资源有限的边缘设备上进行推理,使在手机等终端设备上部署成为可能。

较小参数版本的大语言模型对计算资源的要求较低,对于希望在使用大语言模型时选择成本效益更高、更易于部署的个人来说非常有用。 18亿参数版本目前仅供研究目的使用。

通义千问探索多模态大模型 首度开源音频理解大模型

为了提供能处理更多输入格式的大语言模型,阿里云还宣布开源 Qwen-Audio和Qwen-Audio-Chat,这两款模型具有更强的音频理解能力,可供研究与商业用途使用。

Qwen-Audio可以理解各种格式的文本和语音信号,包括人声、自然声和音乐,并输出文本。 它能执行30多种音频处理任务,如多语言转录、语音编辑、音频概要与分析等。 其会话微调版本 Qwen-Audio-Chat可支持基于音频的多轮问答,并可执行多种面向音频的任务,如感知人声的情绪和语调。

这项成果是阿里云向开源社区提供多模态大型语言模型的又一贡献。 今年早些时候,阿里云宣布推出开源大规模视觉语言模型Qwen-VL及其会话微调版本Qwen-VL-Chat,可理解视觉讯息并执行视觉任务。

自8月以来,包括Qwen-7B、Qwen-14B和Qwen-VL及其会话微调版在内的开源大语言模型在阿里云开源AI模型社区ModelScope和Hugging Face上的下载量合计超过150万次。 ModelScope已成为中国最大的AI模型社区,拥有超过280万活跃开发者,迄今为止模型下载量已超过1亿次。

Tags: 创新与研发

其他资讯

信息技术

阿里加大AI投入奏效 云收入增长36% 千问C端MAU突破3亿

2026年3月20日
信息技术

华为发布新一代算力底座,为世界提供新选择

2026年3月3日
信息技术

千问春节“一句话下单”近2亿次;阿里云上线四大开源模型

2026年3月1日
信息技术

Qwen3.5:为高效率而生的原生多模态模型

2026年2月17日
信息技术

英迈中国正式签约成为甲骨文中国首家云总代理(VAD)

2026年2月5日
信息技术

香港科技大学与英特尔共建联合实验室,聚焦高能效智能计算

2026年2月4日
<简体> <繁體>

“新材料及电子化学品行业高质量发展园区行”考察团到访卡博特珠海工厂

2026年3月31日

...

安森美发布中国战略,推动创新,加速全球增长

2026年4月1日

...

通用净水与康丽根中国达成战略合并 双强携手 共筑净水产业新生态

2026年4月1日

...

诺华持续加大在华投资 助力医药创新高质量发展

2026年3月23日

...

阿克苏诺贝尔助力全球最大绿氢氨醇一体化项目

2026年3月26日

...

日产Formula E车队宣布与Alpine Tech达成赞助协议

2026年3月27日

...

携手四十载,再启新征程!东风与康明斯共签合作备忘录

2026年3月19日

...

锚定工业AI‘操作系统’,西门子在京发布新技术并拓展伙伴合作

2026年3月24日

...

阿斯利康宣布在上海建立细胞疗法商业化生产供应基地与创新中心

2026年3月20日

...

Concentrix与大连民族大学开启校企战略协作,共建东北亚客户体验行业人才成长引擎

2026年3月25日

...

华业网 (Greater China Business) 致力于促进全球跨国公司、机构在华贸易、投资与业务发展;促进大中华区业务交流与合作;关注最新企业动态和行业趋势;分享经营与管理经验;传播卓越理念,为各方在华取得商业成功,促进可持续发展、友好交流贡献力量。

联 系 我 们 | CONTACT US

商务合作联系:  partnership#apac-business.com

媒体资讯联系:  editor#apac-business.com

人力资源联系:  hr#apac-business.com

* (替换# 为 @)

www.apac-business.com

  • 首 页
  • 可 持 续 发 展
  • 投 资
  • 市 场
  • 合 作
  • 创 新
  • 人 事
  • 观 点

Copyright © 华业网 Greater China Business | 沪ICP备2022016631号-2

No Result
View All Result
  • 首 页
  • 可 持 续 发 展
  • 投 资
  • 市 场
  • 合 作
  • 创 新
  • 人 事
  • 观 点

Copyright © 华业网 Greater China Business | 沪ICP备2022016631号-2

沪公网安备 31011402010150号