面对微软的NPU挑战,英伟达如何捍卫其AI PC愿景?
随着微软大力推进AI PC体验,英伟达正在积极争取开发者的支持,试图在新兴的人工智能个人电脑领域占据一席之地。尽管英伟达是数据中心人工智能基础设施无可争议的领导者,但在AI PC这一新战场上,其地位远未稳固。
2024年初以来,Windows的未来方向明确指向集成更多AI增强功能和体验,如实时字幕、翻译、MS Paint中的图像生成等。这些特性构成了Copilot+ PC的核心,但要获得此称号,PC必须配备满足微软最低性能标准的硬件,特别是需要一个能够实现至少40 TOPS(每秒万亿次操作)的神经处理单元(NPU),以及至少16GB RAM和256GB存储空间。目前,仅有高通、英特尔、AMD的部分处理器符合要求,而即便英伟达最新的RTX 5090显卡拥有超过3.3 petaFLOPS的计算能力,也未能达到微软对NPU的要求。
然而,这并不意味着英伟达在这场竞赛中落后。自2018年起,英伟达就致力于将AI功能引入PC,并推出了DLSS技术以提升游戏帧率。此外,通过RTX AI工具包和Nvidia Inference Microservices (NIMs),英伟达为开发者提供了优化和部署genAI模型的平台。虽然部分应用直接面向最终用户,但许多最新软件旨在吸引开发者社区。
尽管如此,微软对NPU的重视已经迫使芯片制造商提供相应硬件,从而设定了新的机器学习性能基准。考虑到Windows庞大的市场份额及微软在软件中深度融合AI的努力,NPU普及至更低预算设备只是时间问题。同时,DirectML和ONNX Runtime的采用简化了应用开发流程,促进了跨硬件平台的兼容性。
对于英伟达而言,这意味着一方面需继续强化GPU在高端AI应用中的优势;另一方面,则需考虑如何与微软合作,探索GPU在本地AI工作负载中的潜力。尽管当前微软文件特别强调NPU的重要性,但已有迹象表明,微软可能计划扩展Copilot+功能至GPU,以应对更加复杂的计算需求。