華業網
  • 首 頁
  • 可 持 續 發 展
  • 投 資
  • 市 場
  • 合 作
  • 創 新
  • 人 事
  • 觀 點
No Result
View All Result
  • 首 頁
  • 可 持 續 發 展
  • 投 資
  • 市 場
  • 合 作
  • 創 新
  • 人 事
  • 觀 點
No Result
View All Result
No Result
View All Result
Home 全行業 信息技術

阿里雲通義千問發布多款AI大模型 多模態、長文本能力全面升級

by Thomas Chang
2025年2月6日
A A

近日阿里雲旗下的通義千問發布性能強大的旗艦版Qwen2.5-Max,並開源升級版視覺理解模型Qwen2.5-VL以及支持百萬token長文本處理的Qwen2.5-1M,不僅展現了通義千問在大模型前沿技術領域的探索成果,更為開發者和企業提供了有力的技術支持。

旗艦版Qwen2.5-Max:對MoE模型最新探索成果

通義千問旗升級版艦版模型Qwen2.5-Max,是對MoE模型的最新探索成果,預訓練數據超過20萬億tokens,綜合性能強勁,在多項主流模型評測基準上錄得高分。 目前,開發者可在Qwen Chat平台體驗模型,企業和機構也可通過阿里雲百鍊平台直接調用新模型API服務。

Qwen2.5-Max在知識(測試大學水平知識的MMLU-Pro)、編程(LiveCodeBench)、全面評估綜合能力的(LiveBench)以及人類偏好對齊(Arena-Hard)等主流權威基準測試上,通義團隊分別對Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本性能進行了評估測試。

指令模型是所有人可直接對話體驗到的模型版本,在 Arena-Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等基準測試中,Qwen2.5-Max 的表現超越了 DeepSeek V3。 同時在MMLU-Pro等其他評估中也展現出了極具競爭力的成績。

Qwen2.5-Max更是在評估全球最佳大語言模型和AI聊天機器人的權威三方基準測試平台Chatbot Arena取得矚目成績。 Qwen2.5-Max在Chatbot Arena最新公布的大模型盲測榜單中,總分全球排名第七,與其他頂級大模型不相上下,它在數學和和編程等單項能力上排名第一,在硬提示(hard prompts),即解決挑戰性任務的複雜提示方面排名第二。

視覺理解模型Qwen2.5-VL多模態處理能力顯著提升

通義千問還開源了全新的視覺理解模型Qwen2.5-VL,推出3B、7B和72B三個尺寸版本。 其中,旗艦版Qwen2.5-VL-72B在13項權威評測中奪得視覺理解冠軍。 目前,不同尺寸及量化版本的Qwen2.5-VL模型已在魔搭社區ModelScope、HuggingFace等平台開源,開發者也可以在Qwen Chat上直接體驗最新模型。

Qwen2.5-VL展現強大多模態能力,不僅能精準識別物體和解析複雜圖像內容,還可理解一小時以上的長視頻,精確回答問題。 此外,該模型能將非結構化數據如發票、表單轉換為JSON等結構化格式,特別適合自動生成財報和法務文檔等場景。

Qwen2.5-VL甚至能夠直接作為視覺智能體進行作,通過指導使用各種工具,在電腦和移動設備上輕鬆執行查詢天氣、訂機票等多步驟任務。

在模型技術方面,與上一代Qwen2-VL相比,Qwen2.5-VL增強了模型對時間和空間尺度的感知能力,並進一步簡化了網絡結構以提高模型效率。 在重要的視覺編碼器設計中,通義團隊從頭開始訓練了原生動態分辨率的ViT,並採用創新結構,讓Qwen2.5-VL擁有更簡潔高效的視覺編解碼能力。

Qwen2.5-1M突破百萬Token

此外,阿里雲通義還開源了支持100萬Tokens上下文的Qwen2.5-1M模型,推出7B及14B兩個尺寸,同時開源推理框架,在處理百萬級別長文本輸入時可實現近7倍的提速。

Qwen2.5-1M已經在ModelScope和HuggingFace等平台開源,相關推理框架也已在GitHub上開源,開發者和企業也可通過阿里雲百鍊平台調用 Qwen2.5-Turbo模型API,或是通過Qwen Chat體驗模型性能及效果。

Qwen2.5-1M擁有優異的長文本處理能力。 在上下文長度為100萬Tokens的大海撈針(Passkey Retrieval)任務中,Qwen2.5-1M 能夠準確地從 1M 長度的文檔中檢索出隱藏信息,僅有7B模型出現了少量錯誤。 在RULER、LV-Eval等基準對複雜長上下文理解任務測試中,Qwen2.5-14B-Instruct-1M表現出色,為開發者提供了一個現有長上下文模型的優秀開源替代。

長文本訓練需大量計算資源,通義團隊將Qwen2.5-1M的上下文長度從4K逐步擴展到256K,再通過Dual Chunk Attention機制,無需額外訓練即可將上下文穩定擴展到1M。 同時,團隊在vLLM引擎基礎上引入稀疏注意力機制,在多個環節進行創新優化,提高推理效率。

 

Tags: 業務與市場

其他資訊

信息技術

澳門新福利巴士與釘釘簽約 共創智慧交通服務

2025年6月7日
信息技術

AMD聯合生態夥伴啟動中國行業生態共建計劃,共拓企業級市場新機遇

2025年6月5日
信息技術

松下家電中國與阿里雲達成AI合作,共探智慧家電創新

2025年5月31日
信息技術

阿里巴巴集團與 SAP 宣布戰略合作 助力企業加速AI數碼化進程

2025年5月28日
信息技術

HashKey集團攜手阿里雲推動Web3創新

2025年5月21日
信息技術

騰訊發布《2024微信品牌保護報告》,彰顯其在數字知識產權保護領域的領導地位

2025年5月20日
<簡體> <繁體>

擁抱AI,工誠臻遠:ABB 加速器中國周為創新加速

2025年6月1日

...

探索電池的無限可能 把握新能源時代的社會變革,松下四維的挑戰

2025年5月20日

...

松下娛樂互動(中國)公司成立儀式暨新品發布會盛大啟幕 以“融合”破界,開啟影像新紀元

2025年5月16日

...

漢威士集團榮獲2025中國法國工商會“DEI卓越獎”

2025年5月29日

...

缺陷檢出率近100%!首個輪胎質檢智能體來了

2025年5月24日

...

賽默飛世爾科技榮登 2025 年《財富》中國 ESG 影響力榜單​

2025年5月20日

...

同心同行 煥新啟航——杭州松下馬達有限公司新工廠開業慶典

2025年5月28日

...

立邦最大汽車塗料生產基地於天津投產,“智”啟汽車行業高質量新篇章

2025年5月23日

...

安邁(Alvarez & Marsal)董事總經理袁皈泰女士訪談

2025年5月20日

...

齊澤凱博士將出任大眾汽車乘用車品牌中國CEO

2025年6月12日

...

華業網 (Greater China Business) 致力於促進全球跨國公司、機構在華貿易、投資與業務發展;促進大中華區業務交流與合作;關注最新企業動態和行業趨勢;分享經營與管理經驗;傳播卓越理念,為各方在華取得商業成功,促進可持續發展、友好交流貢獻力量。

聯 系 我 們 | CONTACT US

商務合作聯繫:  partnership#apac-business.com

媒體資訊聯繫:  editor#apac-business.com

人力資源聯繫:  hr#apac-business.com

* (替換# 為 @)

www.apac-business.com

  • 首 頁
  • 可 持 續 發 展
  • 投 資
  • 市 場
  • 合 作
  • 創 新
  • 人 事
  • 觀 點

Copyright © 華業網 Greater China Business | 滬ICP備2022016631號-2

No Result
View All Result
  • 首 頁
  • 可 持 續 發 展
  • 投 資
  • 市 場
  • 合 作
  • 創 新
  • 人 事
  • 觀 點

Copyright © 華業網 Greater China Business | 滬ICP備2022016631號-2

滬公網安備 31011402010150號