华业网
  • 首 页
  • 可 持 续 发 展
  • 投 资
  • 市 场
  • 合 作
  • 创 新
  • 人 事
  • 观 点
No Result
View All Result
  • 首 页
  • 可 持 续 发 展
  • 投 资
  • 市 场
  • 合 作
  • 创 新
  • 人 事
  • 观 点
No Result
View All Result
No Result
View All Result
Home 全行业 信息技术

阿里云通义千问发布多款AI大模型 多模态、长文本能力全面升级

by Thomas Chang
2025年2月6日
A A

近日阿里云旗下的通义千问发布性能强大的旗舰版Qwen2.5-Max,并开源升级版视觉理解模型Qwen2.5-VL以及支持百万token长文本处理的Qwen2.5-1M,不仅展现了通义千问在大模型前沿技术领域的探索成果,更为开发者和企业提供了有力的技术支持。

旗舰版Qwen2.5-Max:对MoE模型最新探索成果

通义千问旗升级版舰版模型Qwen2.5-Max,是对MoE模型的最新探索成果,预训练数据超过20万亿tokens,综合性能强劲,在多项主流模型评测基准上录得高分。 目前,开发者可在Qwen Chat平台体验模型,企业和机构也可通过阿里云百炼平台直接调用新模型API服务。

Qwen2.5-Max在知识(测试大学水平知识的MMLU-Pro)、编程(LiveCodeBench)、全面评估综合能力的(LiveBench)以及人类偏好对齐(Arena-Hard)等主流权威基准测试上,通义团队分别对Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本性能进行了评估测试。

指令模型是所有人可直接对话体验到的模型版本,在 Arena-Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等基准测试中,Qwen2.5-Max 的表现超越了 DeepSeek V3。 同时在MMLU-Pro等其他评估中也展现出了极具竞争力的成绩。

Qwen2.5-Max更是在评估全球最佳大语言模型和AI聊天机器人的权威三方基准测试平台Chatbot Arena取得瞩目成绩。 Qwen2.5-Max在Chatbot Arena最新公布的大模型盲测榜单中,总分全球排名第七,与其他顶级大模型不相上下,它在数学和和编程等单项能力上排名第一,在硬提示(hard prompts),即解决挑战性任务的复杂提示方面排名第二。

视觉理解模型Qwen2.5-VL多模态处理能力显著提升

通义千问还开源了全新的视觉理解模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本。 其中,旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军。 目前,不同尺寸及量化版本的Qwen2.5-VL模型已在魔搭社区ModelScope、HuggingFace等平台开源,开发者也可以在Qwen Chat上直接体验最新模型。

Qwen2.5-VL展现强大多模态能力,不仅能精准识别物体和解析复杂图像内容,还可理解一小时以上的长视频,精确回答问题。 此外,该模型能将非结构化数据如发票、表单转换为JSON等结构化格式,特别适合自动生成财报和法务文档等场景。

Qwen2.5-VL甚至能够直接作为视觉智能体进行作,通过指导使用各种工具,在电脑和移动设备上轻松执行查询天气、订机票等多步骤任务。

在模型技术方面,与上一代Qwen2-VL相比,Qwen2.5-VL增强了模型对时间和空间尺度的感知能力,并进一步简化了网络结构以提高模型效率。 在重要的视觉编码器设计中,通义团队从头开始训练了原生动态分辨率的ViT,并采用创新结构,让Qwen2.5-VL拥有更简洁高效的视觉编解码能力。

Qwen2.5-1M突破百万Token

此外,阿里云通义还开源了支持100万Tokens上下文的Qwen2.5-1M模型,推出7B及14B两个尺寸,同时开源推理框架,在处理百万级别长文本输入时可实现近7倍的提速。

Qwen2.5-1M已经在ModelScope和HuggingFace等平台开源,相关推理框架也已在GitHub上开源,开发者和企业也可通过阿里云百炼平台调用 Qwen2.5-Turbo模型API,或是通过Qwen Chat体验模型性能及效果。

Qwen2.5-1M拥有优异的长文本处理能力。 在上下文长度为100万Tokens的大海捞针(Passkey Retrieval)任务中,Qwen2.5-1M 能够准确地从 1M 长度的文档中检索出隐藏信息,仅有7B模型出现了少量错误。 在RULER、LV-Eval等基准对复杂长上下文理解任务测试中,Qwen2.5-14B-Instruct-1M表现出色,为开发者提供了一个现有长上下文模型的优秀开源替代。

长文本训练需大量计算资源,通义团队将Qwen2.5-1M的上下文长度从4K逐步扩展到256K,再通过Dual Chunk Attention机制,无需额外训练即可将上下文稳定扩展到1M。 同时,团队在vLLM引擎基础上引入稀疏注意力机制,在多个环节进行创新优化,提高推理效率。

 

Tags: 业务与市场

其他资讯

信息技术

澳门新福利巴士与钉钉签约 共创智慧交通服务

2025年6月7日
信息技术

AMD联合生态伙伴启动中国行业生态共建计划,共拓企业级市场新机遇

2025年6月5日
信息技术

松下家电中国与阿里云达成AI合作,共探智慧家电创新

2025年5月31日
信息技术

阿里巴巴集团与 SAP 宣布战略合作 助力企业加速AI数码化进程

2025年5月28日
信息技术

HashKey集团携手阿里云推动Web3创新

2025年5月21日
信息技术

腾讯发布《2024微信品牌保护报告》,彰显其在数字知识产权保护领域的领导地位

2025年5月20日
<简体> <繁體>

汉威士集团大中华区首席人才官Janet Zhang荣获2025 Campaign亚太Women Leading Change奖

2025年5月29日

...

缺陷检出率近100%!首个轮胎质检智能体来了

2025年5月24日

...

松下娱乐互动(中国)公司成立仪式暨新品发布会盛大启幕 以“融合”破界,开启影像新纪元

2025年5月16日

...

比亚迪连续三年蝉联凯度BrandZ最具价值全球汽车品牌榜TOP10,成为全球汽车行业增速最快的品牌之一!

2025年5月17日

...

松下家电中国与阿里云达成AI合作,共探智慧家电创新

2025年5月31日

...

澳门新福利巴士与钉钉签约 共创智慧交通服务

2025年6月7日

...

诺华中国放射性药品生产项目顺利封顶,助力肿瘤精准治疗药物在华可及

2025年5月23日

...

英飞凡®在华获批成为首个且唯一*一个用于治疗局限期小细胞肺癌的免疫疗法

2025年6月5日

...

vivo出席博鳌亚洲论坛国际科技与创新论坛2025年香港会议

2025年6月8日

...

拜耳Co.Lab再迎两家中国生物技术初创企业加入

2025年5月17日

...

华业网 (Greater China Business) 致力于促进全球跨国公司、机构在华贸易、投资与业务发展;促进大中华区业务交流与合作;关注最新企业动态和行业趋势;分享经营与管理经验;传播卓越理念,为各方在华取得商业成功,促进可持续发展、友好交流贡献力量。

联 系 我 们 | CONTACT US

商务合作联系:  partnership#apac-business.com

媒体资讯联系:  editor#apac-business.com

人力资源联系:  hr#apac-business.com

* (替换# 为 @)

www.apac-business.com

  • 首 页
  • 可 持 续 发 展
  • 投 资
  • 市 场
  • 合 作
  • 创 新
  • 人 事
  • 观 点

Copyright © 华业网 Greater China Business | 沪ICP备2022016631号-2

No Result
View All Result
  • 首 页
  • 可 持 续 发 展
  • 投 资
  • 市 场
  • 合 作
  • 创 新
  • 人 事
  • 观 点

Copyright © 华业网 Greater China Business | 沪ICP备2022016631号-2

沪公网安备 31011402010150号