华业网
  • 首 页
  • 可 持 续 发 展
  • 投 资
  • 市 场
  • 合 作
  • 创 新
  • 人 事
  • 观 点
No Result
View All Result
  • 首 页
  • 可 持 续 发 展
  • 投 资
  • 市 场
  • 合 作
  • 创 新
  • 人 事
  • 观 点
No Result
View All Result
No Result
View All Result
Home 全行业 信息技术

阿里云通义千问发布多款AI大模型 多模态、长文本能力全面升级

by Thomas Chang
2025年2月6日
A A

近日阿里云旗下的通义千问发布性能强大的旗舰版Qwen2.5-Max,并开源升级版视觉理解模型Qwen2.5-VL以及支持百万token长文本处理的Qwen2.5-1M,不仅展现了通义千问在大模型前沿技术领域的探索成果,更为开发者和企业提供了有力的技术支持。

旗舰版Qwen2.5-Max:对MoE模型最新探索成果

通义千问旗升级版舰版模型Qwen2.5-Max,是对MoE模型的最新探索成果,预训练数据超过20万亿tokens,综合性能强劲,在多项主流模型评测基准上录得高分。 目前,开发者可在Qwen Chat平台体验模型,企业和机构也可通过阿里云百炼平台直接调用新模型API服务。

Qwen2.5-Max在知识(测试大学水平知识的MMLU-Pro)、编程(LiveCodeBench)、全面评估综合能力的(LiveBench)以及人类偏好对齐(Arena-Hard)等主流权威基准测试上,通义团队分别对Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本性能进行了评估测试。

指令模型是所有人可直接对话体验到的模型版本,在 Arena-Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等基准测试中,Qwen2.5-Max 的表现超越了 DeepSeek V3。 同时在MMLU-Pro等其他评估中也展现出了极具竞争力的成绩。

Qwen2.5-Max更是在评估全球最佳大语言模型和AI聊天机器人的权威三方基准测试平台Chatbot Arena取得瞩目成绩。 Qwen2.5-Max在Chatbot Arena最新公布的大模型盲测榜单中,总分全球排名第七,与其他顶级大模型不相上下,它在数学和和编程等单项能力上排名第一,在硬提示(hard prompts),即解决挑战性任务的复杂提示方面排名第二。

视觉理解模型Qwen2.5-VL多模态处理能力显著提升

通义千问还开源了全新的视觉理解模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本。 其中,旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军。 目前,不同尺寸及量化版本的Qwen2.5-VL模型已在魔搭社区ModelScope、HuggingFace等平台开源,开发者也可以在Qwen Chat上直接体验最新模型。

Qwen2.5-VL展现强大多模态能力,不仅能精准识别物体和解析复杂图像内容,还可理解一小时以上的长视频,精确回答问题。 此外,该模型能将非结构化数据如发票、表单转换为JSON等结构化格式,特别适合自动生成财报和法务文档等场景。

Qwen2.5-VL甚至能够直接作为视觉智能体进行作,通过指导使用各种工具,在电脑和移动设备上轻松执行查询天气、订机票等多步骤任务。

在模型技术方面,与上一代Qwen2-VL相比,Qwen2.5-VL增强了模型对时间和空间尺度的感知能力,并进一步简化了网络结构以提高模型效率。 在重要的视觉编码器设计中,通义团队从头开始训练了原生动态分辨率的ViT,并采用创新结构,让Qwen2.5-VL拥有更简洁高效的视觉编解码能力。

Qwen2.5-1M突破百万Token

此外,阿里云通义还开源了支持100万Tokens上下文的Qwen2.5-1M模型,推出7B及14B两个尺寸,同时开源推理框架,在处理百万级别长文本输入时可实现近7倍的提速。

Qwen2.5-1M已经在ModelScope和HuggingFace等平台开源,相关推理框架也已在GitHub上开源,开发者和企业也可通过阿里云百炼平台调用 Qwen2.5-Turbo模型API,或是通过Qwen Chat体验模型性能及效果。

Qwen2.5-1M拥有优异的长文本处理能力。 在上下文长度为100万Tokens的大海捞针(Passkey Retrieval)任务中,Qwen2.5-1M 能够准确地从 1M 长度的文档中检索出隐藏信息,仅有7B模型出现了少量错误。 在RULER、LV-Eval等基准对复杂长上下文理解任务测试中,Qwen2.5-14B-Instruct-1M表现出色,为开发者提供了一个现有长上下文模型的优秀开源替代。

长文本训练需大量计算资源,通义团队将Qwen2.5-1M的上下文长度从4K逐步扩展到256K,再通过Dual Chunk Attention机制,无需额外训练即可将上下文稳定扩展到1M。 同时,团队在vLLM引擎基础上引入稀疏注意力机制,在多个环节进行创新优化,提高推理效率。

 

Tags: 业务与市场

其他资讯

信息技术

英特尔助力阿里云推出多款云实例与存储方案,共筑AI时代云端算力基石

2025年9月30日
信息技术

以创新引领功率未来,英飞凌亮相PCIM Asia 2025

2025年9月29日
信息技术

率先实现后量子安全算法技术落地上车!小鹏汽车与阿里云签署后量子加密安全合作协议

2025年9月26日
信息技术

阿里云公布国际扩展计划 为新一代AI创新赋能

2025年9月25日
信息技术

美的集团与华为签署战略合作协议,共拓AI领域创新生态

2025年9月21日
信息技术

华为发布全球最强算力超节点和集群

2025年9月19日
<简体> <繁體>

霍尼韦尔与LS电气宣布达成全球合作伙伴关系 助力加速数据中心和电池储能系统创新

2025年10月15日

...

首单外资消费REITs华夏凯德商业REIT成功上市

2025年9月30日

...

新“智”涌现“慧”聚人气,中联重科精彩亮相2025中国国际农机展

2025年10月28日

...

NBA中国与阿里云宣布达成多年合作焕新球迷体验

2025年10月10日

...

上海迪士尼度假区与vivo宣布达成战略联盟

2025年10月14日

...

用科技守护生命!中联重科高精尖产品闪耀中国国际消防展

2025年10月16日

...

Honda中国与东风集团股份合作开展 氢燃料电池商用车社会示范运行

2025年10月23日

...

强生医疗科技携手行业专家和丁香园共同启动“房颤百问百答答案书”项目 助力提升房颤诊疗理念规范化

2025年10月18日

...

霍尼韦尔第四届绿色发展峰会在京举办 碳“循”新动力共筑全生态链

2025年10月23日

...

波音公司任命陆一鸣为波音中国总裁

2025年10月27日

...

华业网 (Greater China Business) 致力于促进全球跨国公司、机构在华贸易、投资与业务发展;促进大中华区业务交流与合作;关注最新企业动态和行业趋势;分享经营与管理经验;传播卓越理念,为各方在华取得商业成功,促进可持续发展、友好交流贡献力量。

联 系 我 们 | CONTACT US

商务合作联系:  partnership#apac-business.com

媒体资讯联系:  editor#apac-business.com

人力资源联系:  hr#apac-business.com

* (替换# 为 @)

www.apac-business.com

  • 首 页
  • 可 持 续 发 展
  • 投 资
  • 市 场
  • 合 作
  • 创 新
  • 人 事
  • 观 点

Copyright © 华业网 Greater China Business | 沪ICP备2022016631号-2

No Result
View All Result
  • 首 页
  • 可 持 续 发 展
  • 投 资
  • 市 场
  • 合 作
  • 创 新
  • 人 事
  • 观 点

Copyright © 华业网 Greater China Business | 沪ICP备2022016631号-2

沪公网安备 31011402010150号