亚马逊推出第二代Arm服务器芯片Graviton2能否快速替代x86UWB 芯片在人物使用场景中的应

在数据中心的战场上,数据正逐渐成为最有价值的资源。然而,挖掘这些数据所蕴含的价值并非易事。这其中,处理器效率与成本的平衡至关重要。随着大数据和人工智能时代的到来,不少拥有庞大数据或提供云服务的大型公司纷纷推出了自研处理器。亚马逊(AWS)便是此类代表之一,他们最近在re:Invent大会上推出了基于Arm架构的服务器芯片Graviton2,这是否意味着x86架构将被完全取代?

关于re:Invent更多报道,请查看雷锋网现场报道《芯片问世、Outposts上市、SageMaker大更新,AWS如何成为“规则改变者”?》。

最终,将设计优良的Arm服务器芯片在实际应用中的表现如何,将会得到验证。我们不必等待传统或新兴服务器芯片制造商说服合作伙伴去支持它们,也不需要软件合作伙伴证明其堆栈和应用程序可以运行于这些新平台之上。

亚马逊网络服务本身就是一个生态系统,它拥有许多自己独有的堆栈,因此它可以像在Las Vegas举办的re:Invent大会后,就像Marvell、Ampere及其它公司一样尝试跟进。

AWS CEO 安迪·贾西宣布,与Annapurna Labs共同设计第二代服务器级Arm处理器,这意味着他们向英特尔和AMD明确表达了,不需要x86处理器就能运行大量工作负载。

使用x86芯片运行工作负载要付出高昂成本,无论是租用还是购买,这也是AWS自行设计芯片的一个重要原因。这仍处于早期阶段,但如果半数以上的大型或超大规模云服务提供商也效仿并构建Arm Neoverse架构定制(或者近似定制)版本,并且积极采纳,那么X86服务器芯片可能会很快从X86迁移到Arm(两到三年)。

微软毫不隐瞒希望50%的人工智能硬件使用Arm处理器,并已开始部署Marvell "Vulcan" ThunderX2处理器于其“Olympus”机架式服务器中。但微软未透露具体数量,我们猜测数量为数万台,与其庞大的机群相比仅占一小部分。谷歌已经涉足较大的Power处理器,并进行了一些部署,但具体规模未知。

据称谷歌是高通 “Amberwing” Centriq 2400最大的支持者,还有传言指出它可能会基于Arm架构自主设计SmartNIC处理器和服务器,但由于专利授权问题,Google可能直接采用开源RISC-V指令集。

阿里巴巴一直涉足Arm服务器,在7月份宣布了基于RISC-V 的玄铁910芯片。而华为海思推出了64核鲲鹏920,我们认为这是对 Arm 推出的“Ares” Neoverse N1 设计的一种变体,其目标客户包括中国的大型企业用户、云服务提供商、电信公司及其他服务供应商。

实际上,我们认为亚马逊Graviton2与鲲鹏920类似,它们可能借鉴了大量来自 Arm Ares 的设计。不像所有 Arm 设计那样,它们并不包括内存或PCI-Express 需要从第三方获得许可才能使用这两个功能。

去年的这个时候,AWS 推出了第一代 Graviton Arm 服务器芯片,有16个 vCPU 运行在 2.3 GHz 时速,以台积电16 纳米工艺制造。在确认 Graviton 处理器是否具备无双线程核心 (SMT) 或8 个带双向 SMT 核心时,我们假设没有 SMT,而只是一个单核 Cosmos 内核,是经过调整过 Cortex-A72 或 Cortex-A75 内核类型的一个更改版。

EC2 计算实例上的 A1 可以支持多达32 GB 主内存,并通过适配层提供最高10 Gb /s 网络带宽,以及最高3.5 Gb/s 弹性块存储 (EBS) 带宽。这使得该晶圆看起来像是针对超级计算而不是一般性的 Arm 服务器晶圆,更接近强力的智能网卡晶圆。

Jassy 在 re:Invent 开幕主题演讲中解释道:“历史上的转折点之一是在我们收购 Annapurna Labs 后,该团队由一群才华横溢且专业的人员组成。”

尽管包括 AWS 在内许多公司都长期以来一直使用 x86 处理器,而且 Intel 是非常紧密的合作伙伴,同时越来越多地开始利用 AMD,如果想要提高性价比,就意味着必须做一些创新。“我们相信 Annapurna Labs 团队能够提供性能方面真正意义上的差异化。” Jassy 解释说,“人们正在广泛地这样做。”

他们最初用于第一个产品的是基于 ARM 架构的一款叫做 Graviton 芯片,该产品是在去年发布给 EC2 实例中的容量扩展流程以及 Web 层应用程序等东西进行优化。

A1 实例有成千上万名客户,但是正如过去所提及以及现在所看到一样,在吞吐量方面并不是特别突出至少与同类产品相比来说如此。而 AWS 也知道这一点,他人也知道这一点。这是一次尝试。

当启动 A1 实例时,他们想了解三个问题:“首先,有人会使用它们吗?第二个问题是合作伙伴生态系统是否能够加强并支持那些需要工具链以便有效运作基于 ARM 应用的用户?第三个问题是我们是否能够让 Graviton 芯片第一次版本达到足够创新,使得您能够用更广泛范围的地基来执行各种各样的任务?”

对于前两个问题,他们感到非常惊喜,因为图标数量,以及客户加载方式显示了 A1 实例被意外地用于某些方式,而合作伙伴生态系统确实以一种显著重要程度加强并支持基础实例。“

对于最后一个问题,即使几年前开始探索第二版 Graviton 这一原因之一,即使即将建设第一个版本,也还不知道是否能够实现这一点,这也许需要一些时间。”

据悉,Graviton2 更像是为了吞吐量而设计,当看起来似乎保持现代 x86 芯片核心水平的时候,其单线性能是一个衡量标准。

具有超过300亿个晶体管和多达64个 vCPU 的Graviton2 晶圆,看起来像真正的心脏,而不是线程数量的一半。我知道 Graviton2 是根据Neoverse N1 使用7 纳米技术制作出来,是 Arm 为帮助客户加快速度而开发出的 “Ares” 芯 片衍生物。在 Arms 视角下,Ares Neoverse N1 最高速度为3.5 GHz,没有内置多线程同步功能,上限介于 2.6 GHz 和 3.1 GHz 之间,

每颗核心有64 KB L1 指令高速缓存和64 KB 数据高速缓存,每颗核心共享跨内核指令高速缓冲区大小相同。此外,每颗复合体内部也有512 KB 或 MB L2 高速缓冲区,一种特殊类型命名Direct Connect 将每颗核心连接到交叉互联网络,其中包含整个体系结构元素之间交互网络;按照 Arms 结合 Ares 的方式,可以扩展最大128 颗核心,或分散到几个小模块中。此54 核变体配置八路记忆设备、一路输入/输出总线以及32 路公共L21 缓冲区共享控制端口,

我认为Graviton 看起来很像64 核 Ares 参考模型,其中添加了一些功能。一项新增功能是一项安全性增强措施,即通过启动过程生成256 位密钥锁定主机板设备,如SSD驱动程序等,以保护敏感信息免受泄露攻击。此外,还增加了一些安全协议,如IPSec 加密等,以进一步增强防御能力,从而保护敏感信息免受窃听攻击。

标签: 机器人

猜你喜欢