经过多年生态建设,Arm服务器CPU市场已经逐渐蓬勃发展,前有亚马逊、Marvell基于Arm架构应用于云端,后有华为海思、平头哥基于Arm推出数据中心服务器,而近几年更是有不少顺应芯片创业潮而生的初创公司,如遇贤微、鸿钧微电子,都在这一领域寻求突破。然而,在这波创新浪潮中,一款名为AmpereOne的全新处理器凭借其独特的设计和性能,为这个行业带来了新的转折点。
Ampere Computing在2023年度战略和产品路线图更新分享中宣布,他们推出了全新的AmpereOne系列处理器,这款处理器采用了5nm工艺制造,并搭载了192个单线程Ampere核。这一核心数量远远超过了英特尔和AMD服务器CPU的核心数。如果我们将这些处理器放在一个具体场景中,比如云环境中的虚拟机运行情况下,对比AMD Genoa(96核)和英特尔Sapphire Rapids(60核),AmpereOne每机架运行的虚拟机数量将是AMD Genoa的2.9倍,是英特尔Sapphire Rapids的4.3倍。
"AmpereOne现已投产并交付给客户,它能够为云工作负载提供更高的性能、高可扩展性以及更高密度,这标志着第一款基于Ampere新自研核产品的大规模投入使用。” Ampere Computing首席产品官Jeff Wittich表示。
从32核到128核,再到现在192核,Ampere发展至今已经有将近6年的历史。在过去两年里,他们不断推出了不同的产品,以满足不同客户需求。而今年,又一次提升到了最高可达192核,对比X86阵营强调“多放10个核心,不如多放一个加速器”,可以看出Ampere对核心数提升执着追求。
对于数据中心市场而言,这意味着什么?
"全新推出的AmpereOne系列处理器并不是要取代之前发布的一些系列,而是在它们基础上进行持续扩展。我们的出发点是希望能够满足不同客户的不同需求。” Jeff Wittich说到。
除了拥有更高计算性能外,AMPERE ONE还进一步增强了内存容量、带宽及IO带宽,并且采用了PCIe 5.0 和 DDR5。这些新增功能主要针对那些对算力要求极高的大型数据中心用户,同时对于边缘计算场景,只需部署32/40W Altra就能满足需要。此外,由于AI算力的爆炸增长,对AI工作负载需求也成为了此次升级的一个重点焦点。
通过收购专注于创建AI软件OnSpecta公司,以及建立形成标准框架Libraries,使得硬件在AI负载下的表现更加优越。此前已经有一些客户成功运用AMPERE One进行大规模云推理,比如Matoha,其鉴别材料应用程序模型就在AMPERE One上运行,用以鉴别玻璃、金属或织物以实现便捷回收。测试结果显示相较AMD Genoa,每秒帧率增加2.3倍;在稳定性的扩散模型与DLRM模型推荐系统方面,也展示了显著优势,即响应查询数量翻番超越竞品。
为了避免内存瓶颈问题,更进一步的是AMPERE ONE拥有128通道PCIeGen5与8通道DDR5,从而提升内存带宽并获得更快速度。此外,该系列还大量采用Chiplet设计来解决内存不均衡问题。
"Chiplet设计实现了一种特殊拓扑结构以及单一裸片计算,同时具有单一大网格结构,有助于我们向顾客提供平衡又高效率。” Jeff Wittich解释道。
即如此大的计算Chiplet被控制Chiplet包围,同时64MB System Level Cache被置于计算芯片上,以此简化访问时间与系统级缓存之间不平衡的问题,无需引入额外HOPs。
那么,在考虑到了这样一个问题:是否会出现与过去Neoverse核心所支持Altra过程存在兼容性挑战?
Jeff Wittich表示,因为所有代码都能在Altra上的执行同样适用于新的ONE series,因此无需任何修改就能正常工作。这再次证明Arm ISA 在数据中心中的潜力,但面对X86建立起来的地位,为云原生生产而生的Amperer仍然还有很长路要走。而Amperer旨在继续扩张其合作伙伴网络,让更多用户接触他们的产品。(雷峰网(公众号:雷峰网))