经过多年积累,Arm服务器CPU市场正在蓬勃发展,亚马逊、Marvell等公司已经成功运用Arm架构在云端,而华为海思和平头哥也推出了基于Arm的数据中心服务器。近几年,更有不少初创公司,如遇贤微和鸿钧微电子,也加入了这一趋势。
最近,专注于开发云原生服务器CPU的Ampere Computing在2023年的战略发布会上宣布,他们推出了全新的AmpereOne系列处理器。这款处理器采用了5nm工艺制造,并搭载了192个单线程核,这一核心数远超英特尔和AMD的当前产品。如果将这些处理器用于云环境中的虚拟机运行中,它们可以支持比AMD Genoa和英特尔Sapphire Rapids多2.9倍或4.3倍的虚拟机数量。
AmpereOne已经投入生产并交付给客户,其首席产品官Jeff Wittich表示,这款新产品提供更高性能、更强扩展性以及更高密度,是基于Ampere自研核技术的首次应用。
自成立以来,Ampere一直致力于提升核心数目,从最初32核到128核,再到最新的一代达到192核。尽管X86阵营如英特尔提倡“增加10个核心相当于一个加速器”,但Ampere似乎更加重视核心数目的提升。
对于数据中心而言,这意味着什么?据Wittich说,全新推出的AmpereOne系列不是取代现有的Altra,而是作为其延伸,以满足不同客户需求。此外,通过增强内存容量、带宽和IO带宽,以及采用PCIe 5.0 和 DDR5技术,使得AI工作负载得到优化。此前三年里,Ampere收购了OnSpecta公司,以提高AI软件性能,现在已建立起能够高效运行AI模型的大型框架库。
测试显示,与AMD Genoa相比,在图像帧率上,AmpereOne表现出色。在DLRM模型推荐系统中,它每秒响应查询数量超过Genoa两倍。值得注意的是,不仅能提高效率,还能解决CSPs面临的问题,比如GPU使用所产生的高能耗,以及容量扩展限制。
为了避免内存墙问题,除了拥有192个内核之外,AmpereOne还配备128通道PCIe Gen5与8通道DDR5以提升内存带宽。此外,该处理器采用的Chiplet设计旨在解决内存不均衡问题。通过这样的设计,可以实现计算裸片与控制芯片之间流畅通信,同时保持系统级缓存与访问时间的一致性,无需额外引入HOPs(跳转)。
关于兼容性问题,由于所有代码都基于ARM ISA,因此任何适用于Altra系列处理器上的代码都可直接在新的One系列上运行,无需修改。最后,由于目标众多且复杂,其中之一就是希望进一步拓展生态合作,让更多用户受益。(来源:雷峰网)