高通的新举措:让AI开发者兴奋的“一次开发,随处运行”解决方案
在智能手机、物联网、汽车、虚拟现实(VR)、增强现实(AR)以及移动PC等多个领域,AI技术正在逐步普及。然而,尽管AI已经成为各行各业不可或缺的一部分,但其体验仍然不够完善,而功能也远未达到预期水平。想要实现优秀的AI体验和产品,一定需要从硬件到软件和系统深度融合。
所有边缘芯片公司都在努力提高自己的优势,但对于有能力和经验的AI开发者来说,将一个应用迁移到不同的产品中依然存在许多挑战,这些挑战阻碍了AI技术的进一步创新和普及。
为了解决这个问题,高通推出了他们最新的解决方案——高通AI软件栈(Qualcomm AI Stack),这包括硬件、软件以及工具,让OEM厂商或者开发者可以通过一次开发,在智能手机、物联网设备、汽车、高端现实(XR)、云端服务以及移动PC等多种场景下应用。
高通技术公司产品管理副总裁Ziad Asghar指出:“不同场景下的功耗需求、模型类型以及部署方式都有所不同,不同业务对于准确性、功耗以及时延等方面也有着不同的平衡要求。”因此,要实现统一且跨平台运行的目标,对于支持各种操作系统,如Android、Windows/Linux,以及面向网联汽车的QNX等,是非常重要的一步。而到了系统软件层面,还需要完整支持接口驱动仿真,以及数学库编译器虚拟平台。此外,还要支持分析器调试器,以便帮助开发者了解如何利用硬件资源进行分析权重分配。此外,还要提供编程语言核心库支持。
Ziad Asghar继续说明:“基于Direct上述这些高通AI软件都可以实现。” Direct可视为一个较低层级库,可以在最靠近模型或硬件位置进行编辑,从而释放硬件性能并保证最高峰值表现。上方运行的是更高效地完成更多用例的地图引擎,同时还支持广泛使用的大型神经网络处理SDK ONNX runtimes TF Lite Micro Direct ML还有TensorFlow PyTorch ONNX框架。
除了这些,更重要的是提供一系列工具套件,其中包括增效工具包(AIMET)用于增强量化与优化模型分析器神经网络架构搜索(NAS)。该增效工具包提供量化感知训练无数据训练浮点转整数运算提升能效至4倍。
此外,该栈还支持基础设施如Prometheus Kubernetes Docker,并且能够兼容诸多SDK,如Snapdragon Ride SDK 智能多媒体SDK Snapdragon Spaces XR 开发者平台,为建立统一SDK奠定基础。
总之,要实现任何单一终端上的特性轻松部署到其他终端上,无论是编译器还是准备优化调度器调试 硬件资源利用,都是一系列关键组成部分。在刚发布不久的高通AI软件栈想要真正实现其愿景,有很长路要走,它们将面临复杂性的大幅提升挑战,并需要大量细致优化与客户紧密合作才能成功。这是一个漫长而艰难但如果成功则可能对其在市场中的巨大影响力产生重大影响的事业。