反复探究26家芯片企业齐力挺华为面对Google TPUAI新玩家时的挑战与难题

探索 AI 芯片新贵面临的挑战与难题:26家芯片企业齐力挺华为,Google TPUAI 领域的竞争格局

距离 Google 第一代 TPU 助力 AlphaGo 打败李世石已有 5 年,Google TPU 已经更新到。与此同时,数据中心领域的 AI 芯片大热,在大量投资下涌现了不少新玩家,尽管未来是光明的,但新玩家们不得不面对 Google 等大企业雄厚的财力和已经形成的市场格局。

近些年,大量资金涌入到数据中心领域新型 AI 处理器的研发中。但在投资热潮的背后,也要注意到问题所在。毕竟,该领域需要处理的问题是特定的,结果不可预测;且该领域的竞争者们财力雄厚(因为它们往往是巨头),能够提供用户黏性非常强的产品。

对于新型 AI 芯片设计公司而言,最大的问题在于:来自终端的数据不足。需要多少个数据中心才能实现盈利?通常,芯片设计公司在设计一个新的 AI 处理器时,首先会弄清楚一个基本问题——如何定义产品的灵活性?是专为单一任务而设计?还是支持更多工作负载?

这两个问题之间存在一系列解决方案,但与过去许多解决方案相比,为 AI 处理器找到合适的是更加困难,对数据中心工作负载而言尤其如此。这就是为什么许多行业分析师认为,只有那些掌握核心技术、拥有强大研发能力以及深入了解客户需求的大企业才能够真正成功地推出具有竞争力的定制化芯片。

“设计和制造定制芯片,一何艰辛?”Synopsys 验证组工程副总裁 Susheel Tadikonda 说。“如果我们要为数据中心提供定制芯片,那么需要多少个数据中心才能实现盈利?也许可以高价出售芯片,但光是这样远远不够。如果是为消费电子设备设计和制造芯片,那么这一领域存在十亿台设备体量,这也是 AISC 芯片能够赚取更多利润的一条路。”

不过就算最终弄清楚多少个数据中心才能实现盈利,也无法确定设计方案。这就如同西门子 EDA 战略和业务发展高级经理 Anoop Saha 所说:“‘芯片自定义’越来越多,以至于能为非常特定的算法创建特殊配置,并提供更高效能和性能。但这会牺牲一部分市场,也会缩短芯片寿命。如果两年后出现了一个新算法,那为旧算法定制的心脏部件价值还能保持原样吗?”

当然,对于像 Google 这样的公司来说,这已经是一个良性循环。“TPU 旨在满足 Google 数据中心内特定的工作负载,”Synopsys 的 Tadikonda 说。“Google 最初打造 TPUs,是因为意识到了处理如此庞大复杂的大规模计算所需建立起大量资源。”并非每家公司都能够使用这种反馈循环,不过其他公司也确实有其他选择。

Xilinx 人工智能软件营销总监 Nick Ni 表示:“很多大型企业已经组建了自己的硬件部门,并针对他们各自重要工作负载打造专用硬件。”但他也警告说,即便这些策略看起来有效,它们依然带来了新的挑战,比如如何平衡成本、时间限制,以及如何确保长期回报率。

最后,不可避免的是,每一次迭代都会影响架构选择。Ni 指出:“通常情况下,一块电路板或是一块晶圆上的存储元素与计算元素差距很大,再加上执行读写操作次数,这都是决定整体能源效率的一个关键因素。而业界正在寻找新的架构,没有人知道什么样的架构才真正有效。不过可以确定的是,要有一定的灵活性,并且在决定架构之前,有足够的事实支撑。”

因此,对于那些想要进入这个快速变化、高风险、高回报潜力的市场的人来说,他们必须准备好迎接不断变化的情景,同时保持耐心,因为即使是在最佳条件下也不可能一下子取得巨大的成功。此外,他们还必须考虑到硬件更新频率,以及添加新的东西给市场带来的压力。在这个充满挑战性的环境中,只有那些最具创新精神、最具韧性的企业才可能获得胜利。

猜你喜欢