中国首台3纳米光刻机铸就传奇Ampere再创纪录自研核云原生服务器CPU亮相

经过多年生态建设,Arm服务器CPU市场已经迅速崛起,前有亚马逊、Marvell基于Arm架构在云端大显身手,后有华为海思、平头哥推出数据中心服务器;近几年,更是出现了许多新兴的Arm服务器CPU初创公司,如遇贤微、鸿钧微电子等。这些创新驱动者正不断扩展这一领域。

Ampere Computing,在2023年度战略和产品路线图更新中宣布,它们推出了全新的AmpereOne系列处理器,这款基于5纳米工艺制造的核心拥有192个单线程核数,再次打破了业界记录。这一核心数量远远超过英特尔和AMD服务器CPU的核心数。在云环境下运行虚拟机时,与同样配置的AMD Genoa或英特尔Sapphire Rapids相比,AmpereOne能够支持更多虚拟机,每个机架上的虚拟机数量是AMD Genoa的2.9倍,是英特尔Sapphire Rapids的4.3倍。

“AmpereOne现已投产并交付给客户,其性能更高、可扩展性更强以及密度更高,是我们第一款基于自研核设计产品。” Ampere Computing首席产品官Jeff Wittich表示。

自成立以来,Ampere已经历经将近6年的发展,此前两年内,他们推出了多款不同型号的产品,从32核到128核不等,但今年他们再次提升到了192核,对比X86阵营如英特尔至强强调“多放10个核,不如多放一个加速器”,Ampere似乎执着于核心数的持续增长。

对于数据中心而言,这意味着什么?

”全新发布的是不是要取代原有的Altra系列,而是在其基础上进行延伸。我们的目标是满足不同客户不同的需求。” Jeff Wittich进一步解释道。

除了提供更高计算性能外,这些新增功能还包括内存容量、带宽和IO带宽提升,以及PCIe 5.0 和 DDR5支持。这些增强功能主要针对那些对算力需求极高的大规模数据中心用户,同时对于边缘计算场景,只需使用40瓦功耗且仅有32核的小型处理器即可满足要求。此外,由于生成式AI算力的爆发需求,对AI工作负载能力也有所提升作为重点之一。

三年前的收购OnSpecta公司,加上建立标准框架Libraries,都助力硬件在AI负载下运行更加快捷。而目前,有许多客户正在利用Ampere提供的心智处理器进行AI推理工作,比如Matoha应用程序模型,就被用于鉴别玻璃金属或织物以实现便捷回收。

测试结果显示,与AMD Genoa相比,在每秒帧数上提高了2.3倍,并在稳定运行扩散模型方面表现优异。此外,在DLRM推荐系统中,也能提供几乎两倍于Genoa查询次数。

值得注意的是,通过采用Chiplet设计来解决内存不均衡问题,以及128通道PCIe Gen5和8通道DDR5,以此提升内存带宽获得速度加快。

采用Chiplet设计可以避免内存墙问题严重化:“我们在Chiplet设计中实现了特定的拓扑结构以及单一计算裸片,同时还有单一大网格结构,这样可以为我们的用户提供平衡性的高性能。反之,他人则需要从一个小芯片传输到另一个小芯片,那种设计会引入延迟问题。” Jeff Wittich解释说。

也就是说,AmpereOne采用的巨大的计算Chiplet被大量控制Chiplet包围的一个大网格结构,其中64MBSystem Level Cache(系统级缓冲区)被放在计算芯片上,可以轻易地访问内存到另一块主板同时避免造成访问时间与系统级缓冲区之间不平衡的问题,没有必要引入额外HOPs(跳转)。

那么是否会出现与过去Neoverse核心相同但未兼容的问题?

Jeff Wittich表示,因为这两者都是基于ARM ISA,所以所有能够在Altra系列处理器上运行代码都能无需修改直接运行在全新的One系列处理器上,无需做任何改动。

通过开发针对云原生的ARM服务器CPU,一次又一次证明了ARM ISA如何使得这个技术成为数据中心潜力的关键。不过面对X86长期占据数据中心生态位,为云原生而生的AMPEREE仍然有很长的一段路要走,

AMPREEE计划继续扩展合作,让自己的产品触及更多用户。(雷峰网(公众号:雷峰网))

猜你喜欢