華業網
  • 首 頁
  • 可 持 續 發 展
  • 投 資
  • 市 場
  • 合 作
  • 創 新
  • 人 事
  • 觀 點
No Result
View All Result
  • 首 頁
  • 可 持 續 發 展
  • 投 資
  • 市 場
  • 合 作
  • 創 新
  • 人 事
  • 觀 點
No Result
View All Result
No Result
View All Result
Home 全行業 信息技術

阿里雲通義千問發布多款AI大模型 多模態、長文本能力全面升級

by Thomas Chang
2025年2月6日
A A

近日阿里雲旗下的通義千問發布性能強大的旗艦版Qwen2.5-Max,並開源升級版視覺理解模型Qwen2.5-VL以及支持百萬token長文本處理的Qwen2.5-1M,不僅展現了通義千問在大模型前沿技術領域的探索成果,更為開發者和企業提供了有力的技術支持。

旗艦版Qwen2.5-Max:對MoE模型最新探索成果

通義千問旗升級版艦版模型Qwen2.5-Max,是對MoE模型的最新探索成果,預訓練數據超過20萬億tokens,綜合性能強勁,在多項主流模型評測基準上錄得高分。 目前,開發者可在Qwen Chat平台體驗模型,企業和機構也可通過阿里雲百鍊平台直接調用新模型API服務。

Qwen2.5-Max在知識(測試大學水平知識的MMLU-Pro)、編程(LiveCodeBench)、全面評估綜合能力的(LiveBench)以及人類偏好對齊(Arena-Hard)等主流權威基準測試上,通義團隊分別對Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本性能進行了評估測試。

指令模型是所有人可直接對話體驗到的模型版本,在 Arena-Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等基準測試中,Qwen2.5-Max 的表現超越了 DeepSeek V3。 同時在MMLU-Pro等其他評估中也展現出了極具競爭力的成績。

Qwen2.5-Max更是在評估全球最佳大語言模型和AI聊天機器人的權威三方基準測試平台Chatbot Arena取得矚目成績。 Qwen2.5-Max在Chatbot Arena最新公布的大模型盲測榜單中,總分全球排名第七,與其他頂級大模型不相上下,它在數學和和編程等單項能力上排名第一,在硬提示(hard prompts),即解決挑戰性任務的複雜提示方面排名第二。

視覺理解模型Qwen2.5-VL多模態處理能力顯著提升

通義千問還開源了全新的視覺理解模型Qwen2.5-VL,推出3B、7B和72B三個尺寸版本。 其中,旗艦版Qwen2.5-VL-72B在13項權威評測中奪得視覺理解冠軍。 目前,不同尺寸及量化版本的Qwen2.5-VL模型已在魔搭社區ModelScope、HuggingFace等平台開源,開發者也可以在Qwen Chat上直接體驗最新模型。

Qwen2.5-VL展現強大多模態能力,不僅能精準識別物體和解析複雜圖像內容,還可理解一小時以上的長視頻,精確回答問題。 此外,該模型能將非結構化數據如發票、表單轉換為JSON等結構化格式,特別適合自動生成財報和法務文檔等場景。

Qwen2.5-VL甚至能夠直接作為視覺智能體進行作,通過指導使用各種工具,在電腦和移動設備上輕鬆執行查詢天氣、訂機票等多步驟任務。

在模型技術方面,與上一代Qwen2-VL相比,Qwen2.5-VL增強了模型對時間和空間尺度的感知能力,並進一步簡化了網絡結構以提高模型效率。 在重要的視覺編碼器設計中,通義團隊從頭開始訓練了原生動態分辨率的ViT,並採用創新結構,讓Qwen2.5-VL擁有更簡潔高效的視覺編解碼能力。

Qwen2.5-1M突破百萬Token

此外,阿里雲通義還開源了支持100萬Tokens上下文的Qwen2.5-1M模型,推出7B及14B兩個尺寸,同時開源推理框架,在處理百萬級別長文本輸入時可實現近7倍的提速。

Qwen2.5-1M已經在ModelScope和HuggingFace等平台開源,相關推理框架也已在GitHub上開源,開發者和企業也可通過阿里雲百鍊平台調用 Qwen2.5-Turbo模型API,或是通過Qwen Chat體驗模型性能及效果。

Qwen2.5-1M擁有優異的長文本處理能力。 在上下文長度為100萬Tokens的大海撈針(Passkey Retrieval)任務中,Qwen2.5-1M 能夠準確地從 1M 長度的文檔中檢索出隱藏信息,僅有7B模型出現了少量錯誤。 在RULER、LV-Eval等基準對複雜長上下文理解任務測試中,Qwen2.5-14B-Instruct-1M表現出色,為開發者提供了一個現有長上下文模型的優秀開源替代。

長文本訓練需大量計算資源,通義團隊將Qwen2.5-1M的上下文長度從4K逐步擴展到256K,再通過Dual Chunk Attention機制,無需額外訓練即可將上下文穩定擴展到1M。 同時,團隊在vLLM引擎基礎上引入稀疏注意力機制,在多個環節進行創新優化,提高推理效率。

 

Tags: 業務與市場

其他資訊

信息技術

華為發表韜(τ)定律,實現晶體管密度與系統性能突破

2026年5月26日
信息技術

阿里邁向AI商業化 雲外部收入加速增長40%

2026年5月14日
信息技術

Akamai – 張軻升任大中華區副總裁,接棒李昇,全面負責中國大陸及港澳台地區的業務戰略與拓展。

2026年4月17日
信息技術

阿里加大AI投入奏效 雲收入增長36% 千問C端MAU突破3億

2026年3月20日
信息技術

華為發布新一代算力底座,為世界提供新選擇

2026年3月3日
信息技術

千問春節“一句話下單”近2億次;阿里雲上線四大開源模型

2026年3月1日
<簡體> <繁體>

阿克蘇諾貝爾與皇派門窗簽署戰略合作協議

2026年4月30日

...

霍尼韋爾UOP升級本土服務能力,賦能煉化企業向價值驅動轉型

2026年5月22日

...

英特爾攜手長安汽車天樞智能座艙、華陽通用、面壁智能和北鬥智聯,以AI Box Ultra引爆端側AI智能體上車

2026年4月29日

...

騰訊發布2026入境支付便利升級三大舉措

2026年5月28日

...

復星醫藥與阿聯酋 Arcera 簽署合作備忘錄 將建立長期戰略合作

2026年4月29日

...

vivo與新華社戰略合作,vivo手機成新華社融媒體指定用機

2026年5月11日

...

復星醫藥與AriBio達成阿爾茨海默口服新葯AR1001全球獨家選擇權合作

2026年5月14日

...

蘇伊士攜手巡鷹新能源集團打造先進鋰電池循環利用基地,助力新能源產業發展

2026年5月8日

...

復星醫藥與應世生物達成戰略合作 獲兩款腫瘤創新FAK抑製劑獨家商業化權益

2026年5月9日

...

布魯克磁共振深化戰略合作,走訪重點用戶共繪核磁發展新篇章

2026年5月1日

...

華業網 (Greater China Business) 致力於促進全球跨國公司、機構在華貿易、投資與業務發展;促進大中華區業務交流與合作;關注最新企業動態和行業趨勢;分享經營與管理經驗;傳播卓越理念,為各方在華取得商業成功,促進可持續發展、友好交流貢獻力量。

聯 系 我 們 | CONTACT US

商務合作聯繫:  partnership#apac-business.com

媒體資訊聯繫:  editor#apac-business.com

人力資源聯繫:  hr#apac-business.com

* (替換# 為 @)

www.apac-business.com

  • 首 頁
  • 可 持 續 發 展
  • 投 資
  • 市 場
  • 合 作
  • 創 新
  • 人 事
  • 觀 點

Copyright © 華業網 Greater China Business | 滬ICP備2022016631號-2

No Result
View All Result
  • 首 頁
  • 可 持 續 發 展
  • 投 資
  • 市 場
  • 合 作
  • 創 新
  • 人 事
  • 觀 點

Copyright © 華業網 Greater China Business | 滬ICP備2022016631號-2

滬公網安備 31011402010150號