在生成式AI时代,为什么不能仅仅只依赖NPU
创始人
2024-05-20 18:47:09
0

原标题:在生成式AI时代,为什么不能仅仅只依赖NPU

前言:移动设备NPU的先行者,却并没有急于自我宣传

早在2013年10月10日,高通方面在官方播客内容中就介绍了一颗名为“Zeroth”,具体型号是QRC52244563-QC的全新处理器设计。

按照当时的说法,这是一款旨在探索“仿生神经元架构”设计的芯片。它的主要目的,是创建、定义和标准化一种更接近生物大脑的计算方式,并且为未来设备的“类人交互”打下基础。

说得更直白一点,这便是Neural Processing Unit(神经处理单元),也就是NPU这个概念在消费级处理器上最早的开端。

有意思的是,如果大家有关注后续几年的高通骁龙产品线就会发现,他们几乎是第一时间就将Zeroth的部分架构和功能引入到了旗下移动平台(骁龙820)里,但却在很长一段时间都对此并未进行宣传。

直到多年后,差不多是骁龙855、骁龙865时代,才开始看到高通强调SoC内置的“NPU”算力数据。自此之后,关于骁龙平台NPU的性能参数、相关AI功能和开发套件,便成为了他们在各种场合下宣传自家产品的“关键词”之一。

为什么高通明明是移动平台上NPU的先导者,却一度对于NPU的宣传并不显得那么“上心”呢?很多很多年后,我们才终于弄清了其中的原因。

效率是NPU最大优势,但却并非AI的“万灵药”

首先大家要知道一个最基本的常识,以目前的高通骁龙SoC为例,在它里面是不是只有NPU能够处理AI相关运算?答案其实是否定的。因为骁龙SoC的CPU、GPU、ISP,甚至是某些型号的基带内部,都会带有AI计算相关的指令集和硬件单元。也就是说除了NPU之外,其他的这些部件同样也可以用于进行AI计算。

但这些不同的处理单元,它们在处理AI运算时的“专长”是不一样的。比如CPU擅长顺序控制和低延迟即时处理,适合延迟敏感型的小模型AI。而GPU则精度极高、且吞吐量巨大,更适合AI图像处理这类超高性能、不允许出错的使用场景。

至于NPU本身,它最大的特点就在于超高的能效,以及相比CPU、GPU兼容更多的AI模型。所以适合作为最核心的AI处理单元,可以满足持续运行AI模型的需求。

当然这也就意味着,即便是目前最先进的NPU,在处理AI任务时也不可能“独当一面”,因为随着AI生态的发展,在大家熟知的消费类电子设备上已经有了种类越来越多的AI模型和应用。它们之中的很多,可能反而是使用CPU或GPU来运算会更快、或者效果更好。

异构计算+生成式NPU,多管齐下驱动AI体验

正因本身就是NPU最初的实践者,所以高通方面在一开始就对NPU的优势和短板都相当清楚,并做了针对性的设计。

一方面,他们从一开始就没有打算只依赖NPU去实现移动设备的AI体验,而是将自家的Adreno GPU、Kryo或Oryon CPU、传感器中枢和内存子系统,与Hexagon NPU一起“打包”成了“高通AI引擎”。

在这个“AI引擎”内,不仅NPU是专为AI计算优化设计,而且高通还通过定制的CPU、自研的GPU和Sensor Hub等部件,为它们都加入了优化过的AI加速能力。这些其他的处理单元可以与高通自家的NPU协同工作,为不同类型的AI应用分配最高效的算力资源。

另一方面,从高通近日公布的技术资料来看,他们旗下的NPU从2015年初次被集成到SoC至今,在9年左右的时间里其实已经更迭了四代不同的基础架构。

在这个过程中,高通的NPU硬件从最初只具备向量和标量两个计算单元,到加入张量加速能力,再到实现微切片推理和100亿参数大模型端侧运行能力,以及完全实现多模态生成式AI设计,每一次都有着极大的硬件变化。与此同时,由它们所驱动的智能手机AI体验,自然也就从简单的语音AI逐步进化为AI拍照、AI摄像、AI大语言模型、AI内容生成等,越来越多样化、也越来越复杂和效果神奇的种种功能。

发布全栈优化工具,高通让AI赋能数十亿设备

在前面说了这么多关于高通在NPU硬件、在AI异构计算方面的历史和产品设计后,可能有的朋友会想到,一方面高通有着庞大的产品线,这就意味着他们的处理器设计不仅限于手机,还包括PC、XR设备、音频产品,甚至是路由器平台,而这些不同设备上的架构,显然很难保证都处于同一个技术世代,所以它们之间必然会存在着不小的差异性。

另一方面,就算硬件再怎么先进,如果开发者不能做到完美的针对性适配,那么就可能白白浪费算力,或是让AI功能实际用起来的体验不够好。

那么面对这些问题,高通又是否想到了解决方案呢?答案是肯定的,这就要提到他们的高通AI软件栈(Qualcomm AI Stack)了。通过这项工具,开发者可以很容易地实现AI功能与AI框架、高通硬件平台、设备操作系统之间的自动适配。

高通AI软件栈支持包括TensorFlow、PyTorch和ONNX在内的不同AI框架与主流运行时,同时它还提供了大量已经确保与高通硬件深度优化过的库文件、服务、系统软件、工具和编译器,开发者可以很容易地选择他们想要开发AI功能的硬件平台,然后就能得到所有最适合的组合。他们也可以只编写一次AI功能,然后就简单地将其移植到由不同高通平台所驱动的不同形态设备上,从智能汽车驾驶舱到平板电脑、智能手机、PC,甚至是xR眼镜。

值得一提的是,在高通方面今天举行的AI技术沟通会上,还专门提到了即将上市的骁龙X Elite PC平台在AI性能方面的领先地位。

众所周知,目前几款最新的x86架构“AI CPU”普遍仅具备算力约为10-16TOPs的集成NPU,且并未彻底实现CPU、GPU与NPU的异构加速。

相比之下,内置45TOPs NPU、采用自研“Oryon”CPU和Adreno GPU的骁龙X Elite,现阶段毫无疑问就有着巨大的AI性能和软件先发优势。考虑到AI加速的系统和应用体验即将成为PC行业的全新“催化剂”,骁龙X Elite很有可能会凭借着提升巨大的性能水准,以及目前行业内最强的AI性能,成为高通有史以来最成功PC平台,并帮助他们站稳PC市场这一重要的新版图。

相关内容

国足全队为林良铭庆祝28岁...
正在印尼随国足备战18强赛的林良铭迎来自己的28岁生日,国足全体教...
2025-06-06 23:22:41
6月6日复盘:银行+新消费...
昨天A股成交量是1.29万亿,因为有增量资金,我觉得市场继续上涨问...
2025-06-06 23:21:58
2025合肥文化旅游(东京...
东京6月6日电 (记者 朱晨曦)6月5日,“皖美旅游 相约合肥”2...
2025-06-06 23:18:39
原创 ...
导语:二战后,英国丢了这么多殖民地,哪个地方最让英国心疼? 众所周...
2025-06-06 23:03:53
原创 ...
世界法学的产生并非一蹴而就的,它经历了几个世纪,也历经了无数次文明...
2025-06-06 23:03:22
原创 ...
近期,因研究太平天国史,特地来到安徽全椒,深入卜集乡大汪村,探寻一...
2025-06-06 23:03:13
原创 ...
淮海战役何张起义,廖运周起义极大加快了解放进程。但是国民党迅速崩盘...
2025-06-06 23:03:05
原创 ...
二战期间,无数条无辜的生命倒在纳粹德国的枪口下,人的生命是宝贵的,...
2025-06-06 23:03:04
原创 ...
历史上有位女子,名为“浣衣皇后”,深得皇帝朱厚照的宠爱,但关于她的...
2025-06-06 23:02:57

热门资讯

一分钟揭晓!德扑之星APP软件... 一分钟揭晓!德扑之星APP软件透明挂,原来一直有挂太坑人了(有挂教程)-哔哩哔哩科技详细教程v;24...
玩家必看攻略∶随便玩三打哈到底... 亲,随便玩三打哈有的,ai轻松简单,又可以获得无穷的乐趣,随便玩三打哈是你和朋友度过闲暇时光的不二选...
跟各位家人们!WePoKe智能... 跟各位家人们!WePoKe智能透视辅助器(软件透明挂)曝光教程(2025已更新)(哔哩哔哩)WePo...
跟各位家人们!德州al透视辅助... 自定义德州al系统规律,只需要输入自己想要的开挂功能,一键便可以生成出微扑克专用辅助器,不管你是想分...
跟各位家人们!鱼扑克透视辅助器... 亲鱼扑克有的,ai轻松简单,又可以获得无穷的乐趣,HH扑克是你和朋友度过闲暇时光的不二选择,赶紧来尝...
跟各位家人们!微扑克WPK透视... 您好:微扑克WPK这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别...
辅助大全!(WePoke)软件... 辅助大全!(WePoke)软件透明挂,原来一直有挂太坑人了(有挂教程)-哔哩哔哩是一款可以让一直输的...
玩家必看攻略∶逍遥卡五星到底有... 您好,逍遥卡五星这款游戏可以开挂的,确实是有挂的,通过微信【29290261】很多玩家在这款游戏中打...
玩家科普教你!(云扑克)软件透... 玩家科普教你!(云扑克)软件透明挂,原来一直有挂太坑人了(有挂教程)-哔哩哔哩科技详细教程v;244...
跟各位家人们!hhpoker大... 亲,hhpoker大菠萝这款游戏可以开挂的,确实是有挂的,。但是开挂要下载第三方辅助软件,hhpok...