華業網
  • 首 頁
  • 可 持 續 發 展
  • 投 資
  • 市 場
  • 合 作
  • 創 新
  • 人 事
  • 觀 點
No Result
View All Result
  • 首 頁
  • 可 持 續 發 展
  • 投 資
  • 市 場
  • 合 作
  • 創 新
  • 人 事
  • 觀 點
No Result
View All Result
No Result
View All Result
Home 全行業 信息技術

阿里雲通義千問發布多款AI大模型 多模態、長文本能力全面升級

by Thomas Chang
2025年2月6日
A A

近日阿里雲旗下的通義千問發布性能強大的旗艦版Qwen2.5-Max,並開源升級版視覺理解模型Qwen2.5-VL以及支持百萬token長文本處理的Qwen2.5-1M,不僅展現了通義千問在大模型前沿技術領域的探索成果,更為開發者和企業提供了有力的技術支持。

旗艦版Qwen2.5-Max:對MoE模型最新探索成果

通義千問旗升級版艦版模型Qwen2.5-Max,是對MoE模型的最新探索成果,預訓練數據超過20萬億tokens,綜合性能強勁,在多項主流模型評測基準上錄得高分。 目前,開發者可在Qwen Chat平台體驗模型,企業和機構也可通過阿里雲百鍊平台直接調用新模型API服務。

Qwen2.5-Max在知識(測試大學水平知識的MMLU-Pro)、編程(LiveCodeBench)、全面評估綜合能力的(LiveBench)以及人類偏好對齊(Arena-Hard)等主流權威基準測試上,通義團隊分別對Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本性能進行了評估測試。

指令模型是所有人可直接對話體驗到的模型版本,在 Arena-Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等基準測試中,Qwen2.5-Max 的表現超越了 DeepSeek V3。 同時在MMLU-Pro等其他評估中也展現出了極具競爭力的成績。

Qwen2.5-Max更是在評估全球最佳大語言模型和AI聊天機器人的權威三方基準測試平台Chatbot Arena取得矚目成績。 Qwen2.5-Max在Chatbot Arena最新公布的大模型盲測榜單中,總分全球排名第七,與其他頂級大模型不相上下,它在數學和和編程等單項能力上排名第一,在硬提示(hard prompts),即解決挑戰性任務的複雜提示方面排名第二。

視覺理解模型Qwen2.5-VL多模態處理能力顯著提升

通義千問還開源了全新的視覺理解模型Qwen2.5-VL,推出3B、7B和72B三個尺寸版本。 其中,旗艦版Qwen2.5-VL-72B在13項權威評測中奪得視覺理解冠軍。 目前,不同尺寸及量化版本的Qwen2.5-VL模型已在魔搭社區ModelScope、HuggingFace等平台開源,開發者也可以在Qwen Chat上直接體驗最新模型。

Qwen2.5-VL展現強大多模態能力,不僅能精準識別物體和解析複雜圖像內容,還可理解一小時以上的長視頻,精確回答問題。 此外,該模型能將非結構化數據如發票、表單轉換為JSON等結構化格式,特別適合自動生成財報和法務文檔等場景。

Qwen2.5-VL甚至能夠直接作為視覺智能體進行作,通過指導使用各種工具,在電腦和移動設備上輕鬆執行查詢天氣、訂機票等多步驟任務。

在模型技術方面,與上一代Qwen2-VL相比,Qwen2.5-VL增強了模型對時間和空間尺度的感知能力,並進一步簡化了網絡結構以提高模型效率。 在重要的視覺編碼器設計中,通義團隊從頭開始訓練了原生動態分辨率的ViT,並採用創新結構,讓Qwen2.5-VL擁有更簡潔高效的視覺編解碼能力。

Qwen2.5-1M突破百萬Token

此外,阿里雲通義還開源了支持100萬Tokens上下文的Qwen2.5-1M模型,推出7B及14B兩個尺寸,同時開源推理框架,在處理百萬級別長文本輸入時可實現近7倍的提速。

Qwen2.5-1M已經在ModelScope和HuggingFace等平台開源,相關推理框架也已在GitHub上開源,開發者和企業也可通過阿里雲百鍊平台調用 Qwen2.5-Turbo模型API,或是通過Qwen Chat體驗模型性能及效果。

Qwen2.5-1M擁有優異的長文本處理能力。 在上下文長度為100萬Tokens的大海撈針(Passkey Retrieval)任務中,Qwen2.5-1M 能夠準確地從 1M 長度的文檔中檢索出隱藏信息,僅有7B模型出現了少量錯誤。 在RULER、LV-Eval等基準對複雜長上下文理解任務測試中,Qwen2.5-14B-Instruct-1M表現出色,為開發者提供了一個現有長上下文模型的優秀開源替代。

長文本訓練需大量計算資源,通義團隊將Qwen2.5-1M的上下文長度從4K逐步擴展到256K,再通過Dual Chunk Attention機制,無需額外訓練即可將上下文穩定擴展到1M。 同時,團隊在vLLM引擎基礎上引入稀疏注意力機制,在多個環節進行創新優化,提高推理效率。

 

Tags: 業務與市場

其他資訊

信息技術

聯想集團與首都信息簽署戰略合作協議

2026年1月17日
信息技術

阿里巴巴千問App推進Agentic AI戰略 將生態核心服務轉化為可執行的AI能力

2026年1月16日
信息技術

雲智融合 , 共築新生態 —— 英邁中國與甲骨文中國攜手開啟AI雲生態共建新篇章

2025年12月20日
信息技術

阿里巴巴千問App接入高德地圖,打造無縫銜接的AI智能化旅行規劃體驗

2025年12月20日
信息技術

阿里投入AI與大消費見效 雲加速增長至34% 即時零售營運效率提升

2025年11月26日
信息技術

阿里巴巴在聯合國COP30氣候大會上發布「八觀季節預測模型」

2025年11月21日
<簡體> <繁體>

加碼本土,輻射亞太:嘉吉北京工廠擴建項目正式啟動

2026年1月29日

...

2026斯凱孚創新峰會暨新品發布會成功舉辦,七大行業新品重磅發布

2026年1月26日

...

現任康明斯動力系統事業部中國總經理相永東將赴任動力系統事業部全球供應鏈執行總監

2026年1月27日

...

菜鳥、鯨芽和淘寶全球購聯手,海外商家可快速進入中國市場

2026年1月23日

...

奧的斯機電產品標識煥新升級

2026年1月31日

...

阿里巴巴千問App推進Agentic AI戰略 將生態核心服務轉化為可執行的AI能力

2026年1月16日

...

波音與合作夥伴在鄭州舉行大型貨機交流活動

2026年1月16日

...

阿斯利康將於2030年前在華投資逾1000億元人民幣,推動下一代創新藥物發展

2026年1月30日

...

現任重慶康明斯發動機有限公司總經理袁軍將接任康明斯動力系統事業部中國總經理

2026年1月27日

...

小鵬汽車與工商銀行廣東省分行達成戰略合作,獲100億元授信額度

2026年1月20日

...

華業網 (Greater China Business) 致力於促進全球跨國公司、機構在華貿易、投資與業務發展;促進大中華區業務交流與合作;關注最新企業動態和行業趨勢;分享經營與管理經驗;傳播卓越理念,為各方在華取得商業成功,促進可持續發展、友好交流貢獻力量。

聯 系 我 們 | CONTACT US

商務合作聯繫:  partnership#apac-business.com

媒體資訊聯繫:  editor#apac-business.com

人力資源聯繫:  hr#apac-business.com

* (替換# 為 @)

www.apac-business.com

  • 首 頁
  • 可 持 續 發 展
  • 投 資
  • 市 場
  • 合 作
  • 創 新
  • 人 事
  • 觀 點

Copyright © 華業網 Greater China Business | 滬ICP備2022016631號-2

No Result
View All Result
  • 首 頁
  • 可 持 續 發 展
  • 投 資
  • 市 場
  • 合 作
  • 創 新
  • 人 事
  • 觀 點

Copyright © 華業網 Greater China Business | 滬ICP備2022016631號-2

滬公網安備 31011402010150號