英特尔今日公布了最新的 Meteor Lake 处理器,并详细介绍了 Meteor Lake 的集成式 NPU。
英特尔表示,Al 正在融入人们生活的方方面面。虽然云端 Al 提供可扩展的计算,但也存在局限性。其拥有依赖连接、高延迟、实施成本高,以及存在隐私问题的特点。MeteorLake 将 Al 引入客户端 PC,提供低延迟 Al 计算,能够在成本更低的情况下更好地保护数据隐私。
英特尔称,从 MeteorLake 开始,英特尔会将 Al 广泛引入 PC,带领数亿台 PC 进入 Al 时代,而庞大的 x86 生态系统将提供广泛的软件模型和工具。
IT 之家附英特尔 NPU 架构详解:
主机接口和设备管理 —— 设备管理区支持微软的新驱动程序模型,称为微软计算驱动程序模型 (MCDM)。这使 Meteor Lake 的 NPU 能够在确保安全性的同时以卓越的方式支持 MCDM,而内存管理单元(MMU)提供多种情况下的隔离,并支持电源和工作负载调度,从而实现快速的低功率状态转换。
多引擎架构 ——NPU 由一个多引擎架构组成,该架构配备两个神经计算引擎,可以共同处理单一工作负载或各自处理不同的工作负载。在神经计算引擎中,有两个主要的计算组件,其一为推理管道一一这是高能效计算的核心驱动因素,通过最大限度地减少数据移动并利用固定功能运作来处理常见的大计算量任务,可以在神经网络执行中实现高效节能。绝大多数计算发生在推理管道上,这个固定功能管道硬件支持标准的神经网络运作。该管道由一个乘积累加运算(MAC)阵列、一个激活功能块和一个数据转换块组成。其二为 SHAVEDSP —— 这是一款专为 Al 设计的高度优化 VLIW DSP(超长指令字 / 数字信号处理器)。流式混合架构向量引擎( SHAVE)可以与推理管道和直接内存访问 (DMA)引擎一起进行管道化,实现在 NPU 上井行进行的真正异构计算,从而最大限度地提高性能。
DMA 引擎 —— 该引擎能够优化编排数据移动,实现最高的能效和性能。