经过多年积累,Arm服务器CPU市场正在蓬勃发展,亚马逊、Marvell等公司已经成功运用Arm架构在云端应用,而华为海思、平头哥则推出了基于Arm的数据中心服务器。此外,一些新兴的初创企业如遇贤微和鸿钧微电子也加入了这一趋势。近期,专注于Arm云原生服务器CPU的Ampere Computing在2023年度战略和产品路线图更新中宣布,其推出全新的AmpereOne系列处理器,这款基于5nm工艺制造的处理器拥有惊人的192个单线程Ampere核心,再次刷新了业界记录。
相比之下,英特尔和AMD服务器CPU核心数量都远不及AmpereOne。在实际场景中,比如云环境中的虚拟机(VM)运行情况下,如果将192核的AmpereOne与96核的AMD Genoa或60核的英特尔Sapphire Rapids进行对比,我们可以看到每个机架上运行虚拟机数量是AMD Genoa的2.9倍,是英特尔Sapphire Rapids的4.3倍。这表明AmpereOne提供了更高性能、高可扩展性以及更高密度,使其成为第一款使用自研核技术生产商。
“AmpereOne已经投产并交付给客户,它能够为云工作负载提供更强大的性能、更广泛的手感,以及更多内存容量。” Ampere Computing首席产品官Jeff Wittich表示。
自从成立以来,大约有6年的时间里,Ampere不断地推出了不同的产品,从32核到128核再到现在这192核心,每一次都是为了满足不同客户需求。对于数据中心而言,这意味着什么?
全新的AmpereOne系列处理器并不旨在取代现有的Altra系列,而是在其基础上进行持续扩展。我们的目标是希望能满足各种各样的客户需求。”
除了计算性能以外,新一代芯片还提升了内存容量、带宽和IO带宽,并采用PCIe 5.0 和 DDR5标准。这些建立主要针对那些对算力有极高需求的大规模数据中心。而对于边缘计算场景,只需部署32核40瓦功耗的小型Altra处理器即可满足要求。此外,由于AI算力的爆炸式增长,对AI工作负载提高成了本次升级重点之一。
通过收购OnSpecta公司以及建立自己的AI团队,加强软件支持,为硬件提供更加优化以适应AI负载运行速度加快。在此背景下,全新的测试结果显示,在图像帧数方面,与同类竞品相比,可达到2.3倍以上效率提升,同时在稳定运行大型模型时表现尤佳。此外,在推荐系统中的DLRM模型测试中,以每秒查询次数计,与竞品相比增幅超过两倍。
值得注意的是,不仅如此,这种设计还解决了一些长期存在的问题,如内存不均衡问题。通过Chiplet设计实现特定的拓扑结构,以及单一计算裸片,并配备单一大网格结构,可以帮助我们为客户提供平衡且具有较高性能的一个平台。当其他设计需要从一个小芯片传输至另一个小芯片时,就会引入延迟问题。但正因为如此,大型计算Chiplet被多个控制Chiplet包围形成的一种设计方式,则避免了这些潜在问题,将64MB System Level Cache放在计算芯片上,便于轻易实现内存到内存之间访问,同时避免造成访问时间与缓冲区之间不平衡的问题,不必再引入额外HOPs来解决这个挑战。
关于是否出现与过去Neoverse核心相同但又不同的兼容性问题?Jeff Wittich指出,因为所有能够跑过Altra系列处理器上的代码,都能直接无需修改地跑转移到全新的series A1 above on the One series processing units,因此不存在任何兼容性的疑虑或改动所需的情况发生。
总结来说,Ambert's Arm-based server CPUs have once again proven the potential of Arm ISA in data centers, but with X86 having established a strong presence in this space, there is still much work to be done for cloud-native solutions like Ampère.
Additionally, Ampère also expressed that it has many goals beyond just one single objective and is looking to expand its ecosystem partnerships to make its products accessible to more users.
(雷峰网公众号:雷峰网)