在2022年的双十一购物狂欢中,消费者不仅能够轻松找到心仪商品,还能接收到高度个性化的推荐,这背后隐藏着推荐系统的巨大变革。AI技术的崛起成为推动推荐系统发展的关键因素,无论是购物平台、直播平台还是视频内容平台,AI都扮演了越来越重要的角色。
数据显示,即使提高推荐相关性的1%,销量也会增加数十亿美元。这表明AI推荐系统已经成为互联网公司业务中不可或缺的一部分。但高价值的AI推荐系统目前仍然受限于少数企业所承担得起的问题。如何实现普及,以及何时我们能够拥有完美的AI推荐系统?这些问题正在引发广泛关注。
为了解决这一问题,我们需要回顾一下过去几十年对算力的需求增长和摩尔定律带来的影响。在过去,虽然CPU足以满足早期简单型号的请求,但随着复杂度提升以及算法进步,特别是在深度学习领域,GPU变得不可或缺。NVIDIA亚太区开发与技术部总经理李曦鹏指出:“从模型并行到数据并行,我们需要做非常多数据交换,这成了大量计算节点间密集通信。”
针对嵌入表和DNN部分进行加速训练,可以使用英伟达提供的一个解决方案——NVIDIA Merlin。在预处理方面,NVTabular可以加速,而Distributed-Embeddings则可以简化TensorFlow 2用户的大规模模型训练过程,并且其性能表现十分突出,比仅使用CPU速度快683倍。
然而,加速计算并不只是硬件升级这么简单,它还涉及软件优化和上层应用整合。例如,HugeCTR是一个开源框架,其目标是优化NVIDIA GPU上的大规模推送。而Merlin Distributed-Embeddings 的模块化设计允许客户根据需求选择不同的模块,从而降低成本并提高效果。
尽管如此,加速计算普及依旧面临两个主要挑战:差异化需求和高门槛不同类型的事务有不同的算法需求,而中小企业往往难以投入庞大的团队来支持复杂型号。此外,即便有强大的工具,如Merlin Distributed-Embeddings 和HugeCTR,只要没有相应的人才支持,他们也无法充分发挥作用,因此云服务合作对于减轻成本和门槛至关重要。
未来10年,将是一个全新的加速计算时代,一旦成功实施,将带来前所未有的价值增长——100倍甚至更多。如果能克服当前面临的一系列挑战,那么将为全球范围内所有行业带来革命性的改变,为经济增值创造千亿美元级别的地标性成果。