阿里云通义千问发布多款AI大模型多模态、长文本能力全面升级

近日阿里云旗下的通义千问发布性能强大的旗舰版Qwen2.5-Max，并开源升级版视觉理解模型Qwen2.5-VL以及支持百万token长文本处理的Qwen2.5-1M，不仅展现了通义千问在大模型前沿技术领域的探索成果，更为开发者和企业提供了有力的技术支持。

旗舰版Qwen2.5-Max：对MoE模型最新探索成果

通义千问旗升级版舰版模型Qwen2.5-Max，是对MoE模型的最新探索成果，预训练数据超过20万亿tokens，综合性能强劲，在多项主流模型评测基准上录得高分。目前，开发者可在Qwen Chat平台体验模型，企业和机构也可通过阿里云百炼平台直接调用新模型API服务。

Qwen2.5-Max在知识（测试大学水平知识的MMLU-Pro）、编程（LiveCodeBench）、全面评估综合能力的（LiveBench）以及人类偏好对齐（Arena-Hard）等主流权威基准测试上，通义团队分别对Qwen2.5-Max的指令（Instruct）模型版本和基座（base）模型版本性能进行了评估测试。

指令模型是所有人可直接对话体验到的模型版本，在 Arena-Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等基准测试中，Qwen2.5-Max 的表现超越了 DeepSeek V3。同时在MMLU-Pro等其他评估中也展现出了极具竞争力的成绩。

Qwen2.5-Max更是在评估全球最佳大语言模型和AI聊天机器人的权威三方基准测试平台Chatbot Arena取得瞩目成绩。 Qwen2.5-Max在Chatbot Arena最新公布的大模型盲测榜单中，总分全球排名第七，与其他顶级大模型不相上下，它在数学和和编程等单项能力上排名第一，在硬提示（hard prompts），即解决挑战性任务的复杂提示方面排名第二。

视觉理解模型Qwen2.5-VL多模态处理能力显著提升

通义千问还开源了全新的视觉理解模型Qwen2.5-VL，推出3B、7B和72B三个尺寸版本。其中，旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军。目前，不同尺寸及量化版本的Qwen2.5-VL模型已在魔搭社区ModelScope、HuggingFace等平台开源，开发者也可以在Qwen Chat上直接体验最新模型。

Qwen2.5-VL展现强大多模态能力，不仅能精准识别物体和解析复杂图像内容，还可理解一小时以上的长视频，精确回答问题。此外，该模型能将非结构化数据如发票、表单转换为JSON等结构化格式，特别适合自动生成财报和法务文档等场景。

Qwen2.5-VL甚至能够直接作为视觉智能体进行作，通过指导使用各种工具，在电脑和移动设备上轻松执行查询天气、订机票等多步骤任务。

在模型技术方面，与上一代Qwen2-VL相比，Qwen2.5-VL增强了模型对时间和空间尺度的感知能力，并进一步简化了网络结构以提高模型效率。在重要的视觉编码器设计中，通义团队从头开始训练了原生动态分辨率的ViT，并采用创新结构，让Qwen2.5-VL拥有更简洁高效的视觉编解码能力。

Qwen2.5-1M突破百万Token

此外，阿里云通义还开源了支持100万Tokens上下文的Qwen2.5-1M模型，推出7B及14B两个尺寸，同时开源推理框架，在处理百万级别长文本输入时可实现近7倍的提速。

Qwen2.5-1M已经在ModelScope和HuggingFace等平台开源，相关推理框架也已在GitHub上开源，开发者和企业也可通过阿里云百炼平台调用 Qwen2.5-Turbo模型API，或是通过Qwen Chat体验模型性能及效果。

Qwen2.5-1M拥有优异的长文本处理能力。在上下文长度为100万Tokens的大海捞针（Passkey Retrieval）任务中，Qwen2.5-1M 能够准确地从 1M 长度的文档中检索出隐藏信息，仅有7B模型出现了少量错误。在RULER、LV-Eval等基准对复杂长上下文理解任务测试中，Qwen2.5-14B-Instruct-1M表现出色，为开发者提供了一个现有长上下文模型的优秀开源替代。

长文本训练需大量计算资源，通义团队将Qwen2.5-1M的上下文长度从4K逐步扩展到256K，再通过Dual Chunk Attention机制，无需额外训练即可将上下文稳定扩展到1M。同时，团队在vLLM引擎基础上引入稀疏注意力机制，在多个环节进行创新优化，提高推理效率。

Tags: 业务与市场

阿里云通义千问发布多款AI大模型多模态、长文本能力全面升级

其他资讯

腾讯混元Hy3正式发布：Agent能力显著提升，产品深度融合

腾讯通过“碳寻计划2.0”催化资金支持新一代减碳创新者，持续推动气候目标落实

HarmonyOS 7 开发者 Beta 正式启动，全场景智能操作系统再升级

联想集团与天津市政府重磅签约联手打造新一代AI算力产品研发制造中心

华为发表韬(τ)定律，实现晶体管密度与系统性能突破

阿里迈向AI商业化云外部收入加速增长40%

阿斯利康与石药集团深化合作，共同开发新型siRNA药物

TÜV南德携手招商车研赋能中国汽车全球化发展

福特汽车与吉利汽车成立西班牙合资公司共享瓦伦西亚工厂产能进行本地化生产

巴斯夫上海及湛江一体化基地工程塑料装置获 ISCC+ 认证

松下电子材料（苏州）有限公司新工厂正式开业，锚定尖端领域，打造产业升级“新引擎”

日产Formula E车队出征上海，迎战本赛季中国第二站赛事

斯凯孚与绿的谐波成立合资公司，聚焦人形机器人精密部件

腾讯混元Hy3正式发布：Agent能力显著提升，产品深度融合

900台锋坦Frontier Pro正式出海启程，“在中国、向全球”战略持续深化

3M携手全球发明大会中国区，赋能青少年科创教育

联系我们 | CONTACT US

阿里云通义千问发布多款AI大模型 多模态、长文本能力全面升级

旗舰版Qwen2.5-Max：对MoE模型最新探索成果

视觉理解模型Qwen2.5-VL多模态处理能力显著提升

Qwen2.5-1M突破百万Token

其他资讯

联 系 我 们 | CONTACT US

阿里云通义千问发布多款AI大模型多模态、长文本能力全面升级

联系我们 | CONTACT US