中国数据存储服务平台

Arm推出人工智能优化的Arm终端计算子系统以及新的Arm Kleidi软件,重新定义移动端体验

Arm 推出人工智能优化的 Arm 终端计算子系统以及新的 Arm Kleidi 软件,重新定义移动端体验

•Arm终端计算子系统 (CSS) 作为新的计算解决方案,结合了 Armv9 架构的优势,以及基于三纳米工艺节点,经过验证和证实为生产就绪的新 Arm CPU 和 GPU 实现,可赋能芯片合作伙伴快速创新,并加快产品上市进程。

•凭借新一代 Arm Cortex-X CPU,人工智能 (AI) 优化的 Arm 终端 CSS 带来最高的 IPC 同比提升,性能提高 36%;新的 Arm Immortalis GPU 的图形性能提高 37%。

•新的 KleidiAI 软件与热门的人工智能框架集成,致力于提供无缝的开发者体验;搭配 Arm CSS 的 KleidiAI 通过 Neon™、SVE2 和 SME2 等一系列 Arm 的加速技术,能显著提高计算应用的性能。

5月30日,Arm 控股有限公司(纳斯达克股票代码:ARM,以下简称“Arm”)今日宣布推出 Arm 终端计算子系统 (CSS),以提供领先的人工智能 (AI) 体验,助力芯片合作伙伴更轻松、快速地构建基于 Arm 架构的解决方案,并加速其产品上市进程。

Arm 终端事业部产品管理副总裁James McNiven

Arm 终端 CSS 为旗舰系统级芯片 (SoC) 提供基础计算要素,其具备最新的 Armv9 CPU、Arm Immortalis GPU、基于三纳米工艺生产就绪的 CPU 和 GPU 物理实现,以及最新的 CoreLink 系统互连和系统内存管理单元 (SMMU)。此外,今日同步推出的 Arm Kleidi 将有助于软件开发者无缝取得 Arm CPU 上的最佳性能,其包括面向 AI 工作负载的 KleidiAI 和面向计算机视觉应用的 KleidiCV。

Arm 高级副总裁兼终端事业部总经理 Chris Bergey 表示:“Arm 平台秉承了 Arm DNA 的能效理念,随着 AI 时代的加速发展,它正为下一波计算需求奠定根基。Arm 终端 CSS 在平台功能方面实现了显著进步,持续突破高端移动端体验的极限。”

前所未有的 CPU 和 GPU 性能和效率

Arm 终端 CSS 是迄今速度最快的 Arm 计算平台,提升了 30% 以上的计算和图形性能,以应对要求苛刻的实际用例中的安卓工作负载,同时也提高了 59% 的 AI 推理速度,适用于更广泛的 AI/机器学习 (ML) 和计算视觉工作负载。

Arm 终端 CSS 的关键在于 Arm 目前性能最强、效率最高、功能最广泛的 CPU 集群,带来最佳的性能和能效。新的 Arm Cortex-X925 实现了 Cortex-X 系列推出以来最高的同比性能提升,该 CPU 利用了领先的三纳米工艺节点,在 3.8GHz 的时钟速率和最大缓存大小的条件下,与 2023 年旗舰智能手机的四纳米 SoC 相比,其单线程性能大幅提高 36%。而在 AI 性能方面,Cortex-X925 取得了惊人的 41% 性能提升,可显著提高如大语言模型 (LLM) 等设备端生成式 AI 的响应能力。

新的 Arm Cortex-A725 CPU 将对前沿性能的不懈追求与出色的效率相结合,该 CPU 将针对 AI 和手游用例的性能效率提高了 35%。这一改进也得益于更新后的 Arm Cortex-A520 CPU 和更新后的 DSU-120,使得采用最新 Armv9 CPU 集群的消费电子设备可提升能效和可扩展性。

新的 Arm Immortalis-G925 GPU 是 Arm 性能最强、效率最高的 GPU,在各款领先的手游应用中实现了 37% 的性能提升,并在多个 AI 和 ML 网络上提升了 34% 的性能。Immortalis-G925 面向旗舰智能手机市场,而包括 Arm Mali™-G725 和 Mali-G625 GPU 在内的全新高可扩展性 GPU 系列,则面向从高端手机到智能手表和 XR 可穿戴设备等广泛的消费电子设备市场。

为实现卓越的开发者创新优化软件

Arm 始终关注全球数百万的开发者,确保他们能够获得打造下一波 AI 应用所需的性能、工具和软件库。为了使开发者能够以最高性能快速实现这些创新,Arm 推出了 Arm Kleidi,其中包括面向 AI 工作负载的 KleidiAI 和面向计算机视觉应用的 KleidiCV。KleidiAI 是一套面向 AI 框架开发者的计算内核,使他们能够在各种设备上轻松获得 Arm CPU 上的最佳性能,并支持 Neon、SVE2 和 SME2 等关键 Arm 架构功能。KleidiAI 与 PyTorch、Tensorflow、MediaPipe 等热门 AI 框架集成,旨在加速 Meta Llama 3、Phi-3 等关键模型的性能,并且还可前后兼容,以确保 Arm 在引入更多技术时依然能适用未来市场的需求。

面向未来 AI 的计算平台

通过将前沿的 CPU 和 GPU 技术、生产就绪的物理实现和持续的软件优化独特结合,Arm 终端 CSS 加之 Kleidi 软件,将为未来 AI 提供计算平台,而 Arm 正是这一未来的基石。

合作伙伴证言

“英特尔代工与 Arm 深度合作,此次发布彰显了 Arm 在终端业务上的进展。我们双方在 Intel 18A 工艺等前沿技术节点上密切合作,以提供一流的功率、性能和面积指标,并基于新的 Arm 终端 CSS 赋能新一代移动端 SoC 产品。”
英特尔代工副总裁兼生态系统技术办公室总经理 Suk Lee

“我们将于今年下半年推出新一代旗舰移动芯片天玑 9400,该芯片将搭载最新的 Armv9 Cortex-X925 CPU 和 Arm Immortalis-G925 GPU。我们与 Arm 保持着长期而紧密的合作关系,致力于不断提升移动芯片的性能和功能,共同推动计算技术的快速发展。”

——联发科技资深副总经理、无线通信事业部总经理徐敬全博士

“在移动端设备中嵌入生成式 AI 功能是客户的主要需求,这就需要将顶尖的芯片技术与领先的计算解决方案相集成。Arm Cortex-X925 CPU 解决方案与三星代工厂最新的三纳米 GAA 工艺节点相结合,可以满足这一需求。我们与 Arm 的长期合作伙伴关系使我们能够在最大化 DTCO 和 PPA 方面从早期便开始展开紧密合作,从而按时交付芯片,并满足性能和效率需求。”

三星电子执行副总裁兼代工设计平台开发主管 Jongwook Kye

“三星与 Arm 不断挑战技术现状,并持续突破移动端的发展极限。AI 的日益普遍改变了整个行业和社会,我们将继续开发前沿技术,以促进和丰富人们的日常生活。我们很高兴能与 Arm 合作,共同开启移动端 AI 的新篇章,让世界各地的人们都能在其设备上享有更多的 AI 计算性能。”

——三星电子总裁兼移动体验 (MX) 业务主管 卢泰文 (Roh Tae-moon)

“AI 优化的 Arm CSS 是 Arm 与台积公司的一个合作典范,共同助力芯片设计商实现前所未有的性能和能效,突破面向 AI 的半导体创新极限。通过与 Arm 以及我们开放创新平台 (OIP) 生态伙伴携手合作,我们能够提供最先进的工艺技术和设计解决方案,赋能客户加速 AI 创新。”

——台积公司生态系统与合作联盟管理部门负责人 Dan Kochpatcharin

vivo 首席芯片规划专家 夏晓菲

“vivo 非常注重用户体验,在 Arm CSS 的技术基础之上,我们与 Arm 的密切合作,共同推动开发者生态,使手机更流畅更好用,同时也为设备端带来了前沿的 AI 体验。我们很高兴看到 Arm 终端 CSS 所引入的新方向,以及通过 Armv9 CPU 与 Arm GPU,这套计算子系统将赋能新一代设备端生成式 AI,从而实现沉浸式的智能移动端解决方案。”

——vivo 首席芯片规划专家 夏晓菲



未经允许不得转载:存储在线 » Arm推出人工智能优化的Arm终端计算子系统以及新的Arm Kleidi软件,重新定义移动端体验
分享到: 更多 (0)