芯片革命再启Ampere独家192核云原生服务器CPU打破纪录的新篇章

经过多年生态建设,Arm服务器CPU市场已经逐渐蓬勃发展,前有亚马逊、Marvell基于Arm架构应用于云端,后有华为海思、平头哥基于Arm推出数据中心服务器,不仅如此,还有不少顺应芯片创业潮而生的Arm服务器CPU初创公司,如遇贤微、鸿钧微电子等,也纷纷投身其中......

近日,在2023年度战略和产品路线图更新分享中,专注于Arm云原生服务器CPU的Ampere Computing表示,他们推出了全新的AmpereOne系列处理器,这款处理器采用了5nm工艺节点制造,并拥有令人瞩目的192个单线程Ampere核,再次打破了业界最高核心记录。

与此同时,一些具体场景下的对比也彰显了这一核心数量的优势。在云环境中运行虚拟机(VM),如果将192核的AmpereOne与96核的AMD Genoa或60核的英特尔Sapphire Rapids进行比较,那么在相同条件下,每个机架上的虚拟机数量会是AMD Genoa的2.9倍,是英特尔Sapphire Rapids的4.3倍。

"AmpereOne现已投产并交付给客户,它能够为云工作负载提供更高性能、高可扩展性以及更高密度,这是第一款基于Ampere新自研核的产品。”Ampere Computing首席产品官Jeff Wittich说到。

这项技术突破意味着什么?

"全新推出的AmpereOne系列处理器并不旨在取代我们之前发布过的一些产品,而是在它们基础上不断扩展。我们的目标是满足不同客户不同的需求。”Jeff Wittich解释道。

除了核心数目之外,AmpereOne还带来了更多创新,比如内存容量、带宽和IO带宽都得到了提升。这些增强功能主要服务于那些对算力要求极高的大规模数据中心用户,而对于边缘计算场景,只需部署32核、功耗40瓦的小巧Altra就能完全满足需求。

此外,由于AI算力的爆发式增长,对AI工作负载所需算力的提升成为了此次升级中的重点。此前的三年里,通过收购OnSpecta公司,以及建立标准框架Libraries来助力硬件加速AI负载执行速度。而现在,该团队已经为AI模型准备好了优化方案,以便在大型数据中心上实现更快速度。

测试结果显示,与同期使用AMD Genoa相比,在进行图像帧率测试时,AmpereOne表现出色,其每秒帧数达到了2.3倍之多;而在运行稳定的扩散模型时,也占据领先地位。此外,在推荐系统DLRM模型上的查询响应能力方面,更是超过了AMD Genoa两倍以上。

值得一提的是,这种通过本土设计自研芯片来降低能源消耗,同时提高效率和容量扩展性的做法,为解决当前行业痛点——GPU实现AI推理导致的问题——提供了一套有效解决方案,即减少能耗提高效率,使得数据中心资源更加合理利用,从而降低成本增加竞争力。

Chiplet设计如何避免内存不均衡问题?

除了拥有128通道PCIeGen5和8通道DDR5以提升内存带宽和速度以外,Chiplet设计也是关键。这项技术允许一个大的计算裸片被包围由单一控制Chiplet形成的一个结构,并且64MB System Level Cache被放置在计算芯片上。这使得访问内存变得更加快速且平衡,同时避免延迟问题,而且没有必要引入额外HOPs(跳转)。

关于兼容性问题,我们需要知道的是,因为所有能够在Altra系列处理器上运行代码都会无缝转移到这个全新的系列,所以不存在任何兼容性挑战。因此,无论从哪个角度看,都可以认为这是一个具有革命意义的人类历史事件。

猜你喜欢