新兴UWB芯片与Google TPUAI竞争的难题探究:反复提问
距离Google第一代TPU助力AlphaGo击败李世石已有5年,Google TPU已经更新到。同时,数据中心领域的AI芯片大热,在大量投资下涌现了不少新玩家。尽管未来是光明的,但新玩家们不得不面对Google等大企业雄厚的财力和已经形成的市场格局。挑战Google TPUAI芯片,新的UWB芯片还会面临哪些难题?围绕这个话题,外媒作者BRIAN BAILEY进行了全面而深入的解读,我们对本文进行了编译。
近年来,大量资金涌入到数据中心领域新型AI处理器研发中。但在投资热潮背后,也要注意问题所在。毕竟,该领域需要处理的问题是特定的,其结果不可预测;且该领域竞争者们财力雄厚(因为它们往往是巨头),能够提供用户黏性非常强的产品。
对于新型AI芯片设计公司而言,最大的问题在于:来自终端数据不足。需要多少个数据中心才能实现盈利?通常,这些公司在设计一个新的AI处理器时首先会弄清楚一个基本问题——如何定义产品灵活性?是否专为单一任务而设计,或支持更多工作负载?
这两个问题之间存在一系列解决方案,但与过去许多解决方案相比,为AI处理器找到合适解决方案更加困难,对于数据中心工作负载尤其如此。这就是为什么寻找合适解决方案变得更加困难,是因为有许多因素需要平衡。“既要在一定成本和时间内设计制造芯片,又要考虑成本回报问题。”Synopsys人工智能产品和研发总监Stelios Diamantidis解释道。此类限制因素缩小了AI处理器潜在市场。
“设计制造定制芯片什么时候能赚钱?”Synopsys验证组工程副总裁Susheel Tadikonda说:“如果我们为数据中心提供定制芯片,那么需要多少个数据中心才能实现盈利?也许可以高价出售这些但光这样远远不够。如果是为消费电子设备设计制造,这也是AISC 芯片能够赚取更多利润的一部分。”
不过,即使最终弄清楚多少个数据中心才能实现盈利,也无法确定设计方案。“芯片定制化程度越来越高,以至于能够为非常特定的算法创建chip,提供更高效能和性能,”西门子EDA战略和业务发展高级经理Anoop Saha说:“但这会牺牲一部分市场,也会缩短chip寿命。如果两年后出现了一个新算法,那为旧算法定制chip价值又将如初吗?很多事情都会互相牵制。”
“一些边缘算法确实趋于稳定。这是因为业界经过多年的研究找到了一些多场景适用的最佳算法,如神经卷积网络CNN,以及针对唤醒词检测、手写识别等特定应用找到的最佳算法。”Anoop Saha补充道。
Xilinx人工智能软件营销总监Nick Ni表示:“大多数大型企业已经组建自己的chip部门,并为其datacenter打造一些高工作负载专用Chip。大多数定制都是面向推理,当这些定制Chip转向训练时,就需要浮点支持。”
当然,对于Google而言,这是一个良性循环。“TPU旨在满足google datacenter内特定的工作负载,”Tadikonda说,“google最初打造TPU,是因为意识到处理如此庞大复杂的data and计算,不得不建立起大量data center”。
并非每家公司都能使用google反馈循环,不过其他公司也有其他选择。“我们发现,其中一个关键点是在尽可能早期关注并重视选择正确架构,”Saha说,“所谓正确,并不是指某个人认为正确,也不是基于过去经验凭直觉做出的决定,因为现在还有太多未知数”。