反复探究新兴Google TPUAI芯片玩家如何克服价格表挑战

新兴Google TPUAI芯片玩家如何克服价格表难题?反复探究:距离Google第一代TPU助力AlphaGo打败李世石已有5年,Google TPU已经更新到。与此同时,数据中心领域的AI芯片大热,在大量投资下涌现了不少新玩家,尽管未来是光明的,但新玩家们不得不面对Google等大企业雄厚的财力和已经形成的市场格局。

近些年,大量资金涌入到数据中心领域新型AI处理器的研发中。但在投资热潮的背后,也要注意到问题所在。毕竟,该领域需要处理的问题是特定的,结果不可预测;且该领域的竞争者们财力雄厚(因为它们往往是巨头),能够提供用户黏性非常强的产品。

对于新型AI芯片设计公司而言,最大的问题在于:来自终端的数据不足。需要多少个数据中心才能实现盈利?通常,芯片设计公司在设计一个新的AI处理器时,首先会弄清楚一个基本问题——如何定义产品的灵活性?是专为单一任务而设计?还是支持更多工作负载?

这两个问题之间存在一系列解决方案,但与过去许多解决方案相比,为AI处理器找到合适解更困难,对于数据中心工作负载尤其如此。这就导致了一系列挑战,比如成本、时间、市场需求以及硬件和算法迭代速度等因素。

“我们发现,其中一个关键点是尽可能早得关注并重视选择正确架构,”西门子的Saha说。“所谓正确,并不是指某个人认为正确,也不是基于过去经验凭直觉做出的决定,因为现在还有太多未知数。”

这些决定既宏观又微观,“比如说,你存储元素与计算元素差距有多大?” Saha问道:“再比如,多久执行一次内存读取,这是一个重要的问题,因为读取和写入将直接影响整体能效。”

行业正在寻找新的架构,没有人知道什么样的架构才真正起作用。不过可以确定的是,要有一定的可塑性,同时在决定架构之前能够确保有足够市场数据来支撑。而硬件和算法迭代快也影响着架构选择,它们决定了从他们购买硬件中赚钱时间,以及愿意支付价格,同时限定了芯片开发总成本。

那么,数据中心芯片使用寿命是多久?

“通常情况下,一般来说,不超过三到四年,”Xilinx 的Ni说。“一些较为激进的大规模商业化可能会在这一时间段内升级,有些则会持续使用更长时间。在人工智能领域,如果我们关注 Google TPU 的发布新闻,就能发现在过去六年左右的时候,他们发布了四个版本。”

换个角度看,即使每18个月都有一次进入数据库机会也是挑战性的。要搅动这个市场并不容易,有两个重要因素——更换现有数据库中的频率,以及添加新东西频率。我看见几乎所有的大规模商业化都尝试更新它的一切,而且几乎每一个建立数据库的人都会合作同一些终端客户。”

最后,可以看到整个行业虽然充满挑战,但也有希望。一部分投资者认为这是赢家的通吃游戏,最终只剩下最大的几个获胜者获得最大份额。一旦被这些公司占领,那些公司的地位就会很难被取代。这就是为什么我们可以看到大量资金流向这个市场。

猜你喜欢