阿里云今日在其年度旗舰峰会云栖大会上宣布,已在全球开源社区上架100多个Qwen 2.5大语言模型。
为市场对强大AI算力日益增长的需求,阿里云宣布全面升级其基础设施,推出一系列包括计算、网络、数据中心架构在内的创新云产品及服务,以支持AI模型的蓬勃发展和广泛应用。
阿里云智能董事长兼首席执行官吴泳铭表示:「阿里云正以前所未有的强度投入AI技术的研发和全球基础设施的建设。 我们的目标是建立面向未来的AI基础设施,以更好地服务我们的全球客户,长远帮助他们释放商业潜能。」
发布逾百个开源模型
新发布的Qwen 2.5 开源模型参数规模从5亿到720亿不等,其知识、数学和编码能力均有提升并能支持超过29种语言,可满足端侧及云部署的需求,支持AI于汽车、游戏、科学研究等各领域的广泛应用。
Qwen 模型系列是阿里云自研的大语言模型,自 2023 年 4 月发布以来备受关注。 目前,Qwen模型在Hugging Face及阿里巴巴开源社区ModelScope等平台的下载量已超过4000万次。 此外,已有超过5万个模型在 Hugging Face 上基于Qwen创建。
Qwen 2.5 的发布将新增超过 100 个开源模型,包括基础模型、指令跟随模型和拥有多种精度等级及方法的量化模型,涵盖语言、音频和视觉等多种模态,以及专门的代码和数学模型。
阿里云智能首席技术官周靖人表示:「我们发布了迄今为止最为广泛的开源倡议,这是一个重要的里程碑。 这项倡议旨在为开发者和不同规模的企业赋能,提升他们使用AI技术的能力,并进一步促进开源社群的增长。 我们将继续致力于投资先进的AI基础设施,以促进生成式AI在不同行业中的广泛应用。」
阿里云还宣布对其自研旗舰模型Qwen-Max进行升级。 升级后的Qwen-Max在语言理解与推理、数学及编程等领域与其他尖端模型有着同等出色的表现。
拓展多模态的边界
阿里云还推出了图像生成器通义万相大型模型家族的新成员——文生视频模型。 该模型能够生成从写实场景到3D动画等多种视觉风格的高品质视频。 该模型可以根据中文和英文的文本指令生成视频,并将静态图像转化为动态视频。 模型采用了先进的扩散变换器(DiT)架构以提升视频重建质量。
阿里云还宣布对其视觉语言模型进行重大更新,推出了Qwen2-VL,支持理解长达20分钟以上的视频并支持基于视频的问答。 Qwen2-VL拥有复杂的推理和决策能力,适用于手机、汽车和机器人中,帮助在特定操作场景下实现自动化。
在电脑编程方面,阿里云推出了由Qwen驱动的AI 程序员。 这款AI助手可支持程序员将任务拆解、代码编写、缺陷修复等开发工作进行自动化处理。 这使开发者能够更加专注于重要工作任务,并进一步提升自己的技能。
AI基础设施全面升级
阿里云还宣布了其全栈AI基础设施的创新升级,涵盖绿色数据中心架构、数据管理、模型训练和推理等方面:
- 下一代数据中心架构应对AI发展热潮:全球AI热潮带动了对高性能算力日益增长且多样化的需求,为此,阿里云发布了其下一代数据中心架构CUBE DC 5.0。 新的CUBE架构通过一系列先进的自研技术,如风液同源冷却架构、全直流电力架构和智能管理系统,提高能源和运营效率。 同时,通过预制模块化设计,部署时间比传统数据中心建设缩短最多50%。
- Open Lake解决方案最大化数据效用:针对组织在管理大量数据时面临的挑战,特别是不断增长的生成式AI需求背景下,阿里云推出Open Lake解决方案。 该方案能够无缝整合大数据引擎,提供统一解决方案,充分发挥数据价值,尤其是为生成式AI应用服务。 通过在单一平台上整合工作流、性能优化和强大的治理能力,实现计算与存储分离、清晰的数据治理,同时显著降低成本和节省时间,提升资源利用效率。
- 「训练推理一体化」AI调度引擎:阿里云推出了PAI AI Scheduler自研云原生调度引擎,将模型训练和推理一体化,旨在提升计算资源管理效率。 通过智能整合多种计算资源、灵活资源调度、实时任务调整和自动故障恢复,该调度引擎有效算力利用率高达90%以上。
- DMS 实现元数据的统一管理:为帮助不同机构高效利用数据及释放数据的价值,阿里云数据库发布了DMS OneMeta+OneOps。 该平台能够实现跨云数据库、数据仓库、数据湖的统一治理,支持高达40多种数据来源。 该平台将数据利用率提高10倍,大幅提升了数据价值转化的效率。
- 更强大的弹性计算服务:阿里云还推出了第九代弹性计算服务(ECS)企业级实例。 最新一代的ECS实例性能大幅提升,例如搜索与推荐场景下的性能较上一代提升30%,数据库应用场景每秒查询率(QPS)较上一代提升17%。
这些更新将为客户和合作伙伴提供更全面的支持,以最大化利用最新技术带来的好处,构建更高效、可持续且普惠的AI应用。