数字芯片革命TPUAI新贵如何克服挑战

在Google TPUAI芯片的引领下,数据中心领域迎来了新的玩家,但这些新贵面临着众多挑战。首先,他们需要解决来自终端的数据不足问题,难以确定多少个数据中心才能实现盈利。此外,设计和制造定制芯片时,还需考虑成本与回报的平衡,以及如何定义产品的灵活性,即是否专为单一任务或支持更多工作负载。

为了应对这些挑战,新玩家必须在成本和时间内设计和制造芯片,同时满足市场需求。这意味着他们需要弄清楚哪些工作负载是最重要的,以及如何提供更高效能和性能,同时保持市场竞争力。不过,即便弄清楚了这一点,也无法保证设计方案不会迅速变老,因为算法不断演进。

一些边缘算法已经趋于稳定,这给予了自定义芯片带来优势,但也存在局限性。例如,大型企业通常会组建自己的芯片部门,为特定的高工作负载打造专用芯片,而小规模公司则可能缺乏资源去做到这一点。

此外,对于推理而非训练来说,一种100%用于推理解决方案可能使用低精度浮点位数,这对于处理多种应用来说显得不够灵活。而对于大企业而言,他们正在投资适用于推理的解决方案,以优化自身在AI领域的定制化高级模型和解决方案。

尽管如此,对于Google而言,其TPU已经形成了一种良性循环,它通过不断学习得到改进。在其他公司中,由于没有类似的反馈循环,他们必须依靠早期关注架构选择,并且基于数据驱动做出决定,以确保能够快速响应变化。如果硬件和算法发展速度快,那么从硬件中赚钱所需时间也会缩短,从而影响整个市场。

最后,不同的人工智能处理器(AI 处理器)有不同的使用寿命,一般情况下为三到四年,有些激进的数据中心可能会更频繁地更新,而有些则会持续使用更长时间。在这个快速变化的大环境下,要搅动人工智能处理器市场并不容易。

猜你喜欢