你的位置:首頁(yè) > 互連技術(shù) > 正文

高通侯紀(jì)磊:全棧AI優(yōu)化打造領(lǐng)先邊緣性能

發(fā)布時(shí)間:2023-08-24 責(zé)任編輯:wenwei

【導(dǎo)讀】7月6日,2023世界人工智能大會(huì)——芯片主題論壇在上海舉辦。會(huì)上,高通全球副總裁兼高通AI研究負(fù)責(zé)人侯紀(jì)磊博士做了題為《全棧AI優(yōu)化 打造領(lǐng)先的邊緣AI性能》的演講,介紹了終端AI的重要性和優(yōu)勢(shì),高通在終端AI方面特別是生成AI方面的進(jìn)展,以及對(duì)于混合AI在高效推動(dòng)AI規(guī)?;涞氐确矫娴目捶ā?/p>


1689680737411069.jpg


全棧式AI優(yōu)化 打造高效能AI


如今,盡管大量AI的訓(xùn)練和推理仍在云端進(jìn)行,但終端側(cè)的人工智能正變得越來(lái)越至關(guān)重要。通過在最靠近數(shù)據(jù)源頭之處處理數(shù)據(jù),并同云端形成互補(bǔ),往往能夠帶來(lái)在隱私、可靠性、低時(shí)延、成本、能耗、個(gè)性化等方面的顯著優(yōu)勢(shì)。


“比如在成本方面,生成式AI通常參數(shù)體量巨大,如果在端側(cè)部署,能夠推動(dòng)成本的顯著降低。而在AI數(shù)字助手方面,手機(jī)、駕艙、PC等使用場(chǎng)景,端側(cè)AI則能夠很好地滿足私密性、個(gè)性化的需求?!焙罴o(jì)磊說(shuō)。


據(jù)侯紀(jì)磊介紹,早在十幾年前,高通便開始了AI方面的研發(fā),其中一個(gè)重要研究方向就是高效能AI,在包括硬件、算法和軟件等層面進(jìn)行了大量的研發(fā)創(chuàng)新。


在高效硬件方面,通過對(duì)高通移動(dòng)平臺(tái)中CPU、GPU、NPU等不同單元進(jìn)行優(yōu)化,最終使得針對(duì)不同任務(wù),能夠選擇合適的計(jì)算模塊運(yùn)行,侯紀(jì)磊認(rèn)為這是高通端側(cè)AI非常顯著的特點(diǎn)。在算法層面,高通具有一支頂尖的深度神經(jīng)網(wǎng)絡(luò)算法團(tuán)隊(duì),有很多原創(chuàng)性的研究成果。在軟件方面,在面向深度學(xué)習(xí)的軟件加速runtime以及SDK/開發(fā)框架方面,高通對(duì)于客戶以及開發(fā)者都做出了很好的支持。


“因此,高通AI研究的一個(gè)非常重要的原則,就是全棧式的AI創(chuàng)新和優(yōu)化。通過跨層的模型、硬件和軟件創(chuàng)新加速AI應(yīng)用,這種早期研發(fā)和技術(shù)發(fā)明對(duì)于引領(lǐng)生態(tài)系統(tǒng)發(fā)展至關(guān)重要,而最終將技術(shù)提供給商業(yè)團(tuán)隊(duì),并通過部署過程中的收獲來(lái)影響未來(lái)的研究,形成正向循環(huán)?!焙罴o(jì)磊說(shuō)。


量化研究處于行業(yè)最前沿


據(jù)侯紀(jì)磊介紹,高通在高效能AI研發(fā)中,一個(gè)重要的部分是整體模型效率研究,目的是在多個(gè)方向縮減AI模型,使其在硬件上高效運(yùn)行。


1689680723396421.jpg


比如在量化方面,學(xué)習(xí)在保持所需精度的同時(shí)降低比特精度;在條件計(jì)算方面,學(xué)習(xí)僅基于輸入執(zhí)行大模型圖例模型部分組件;在神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索方面,學(xué)習(xí)設(shè)計(jì)更小的神經(jīng)網(wǎng)絡(luò),能夠在真實(shí)硬件上媲美或超過人工設(shè)計(jì)架構(gòu);在編譯方面,學(xué)習(xí)編譯AI模型以實(shí)現(xiàn)高效的硬件執(zhí)行等。


“在量化方面,高通一直在業(yè)界進(jìn)行無(wú)論是從學(xué)術(shù)研究還是落地層面的推動(dòng)。包括Stable Diffusion和ChatGPT等最終要在端側(cè)實(shí)現(xiàn),量化一定是非常重要的手段。在高效能的推理方面,整數(shù)的點(diǎn)運(yùn)算是非常重要的方向。在這方面,高通在積極推動(dòng)相關(guān)學(xué)術(shù)研究,包括在頂級(jí)學(xué)術(shù)會(huì)議上的發(fā)布一些論文的同時(shí),也會(huì)定期放到開源的工具包AIMET中。通過領(lǐng)先的AI研究和快速商業(yè)化,推動(dòng)行業(yè)向整數(shù)推理和高能效AI方向發(fā)展?!焙罴o(jì)磊說(shuō)。


侯紀(jì)磊還重點(diǎn)提及了高通在2020年的一項(xiàng)研究成果——AdaRound量化研究算法,包括很多先進(jìn)的理念和技術(shù)。


“高通能夠?qū)table Diffusion引入端側(cè),AdaRound就是其中一個(gè)非常重要的量化手段。此外,在大語(yǔ)言模型來(lái)到4bit時(shí),包括GPTQ等主流技術(shù),實(shí)際上也是基于AdaRound演進(jìn)的簡(jiǎn)化。所以在量化方面,不管是學(xué)界還是業(yè)界,高通都處于非常前沿的位置?!焙蚣o(jì)磊說(shuō)。


廣泛賦能眾多類型終端


在今日開幕的2023 世界人工智能大會(huì)(WAIC)上,第二代驍龍8移動(dòng)平臺(tái)的高通AI引擎榮獲此次大會(huì)的頂級(jí)獎(jiǎng)項(xiàng):SAIL獎(jiǎng)——卓越人工智能引領(lǐng)者獎(jiǎng)。


1689680709540917.jpg


第二代驍龍8憑借面向整個(gè)平臺(tái)的開創(chuàng)性AI智能設(shè)計(jì)賦能了非凡用戶體驗(yàn),樹立了網(wǎng)聯(lián)計(jì)算的新標(biāo)桿。其搭載高通技術(shù)公司處理速度最快、最先進(jìn)的高通 AI 引擎,通過軟硬件的一系列創(chuàng)新,相較上一代帶來(lái)4.35倍的AI性能提升和60%的能效提升,從而為越來(lái)越多的創(chuàng)新型AI用例和AI增強(qiáng)的用戶體驗(yàn)提供強(qiáng)大的性能基礎(chǔ)。


高通 AI 引擎由多個(gè)硬件和軟件組件組成,用于在驍龍移動(dòng)平臺(tái)上為終端側(cè) AI 推理加速。它采用異構(gòu)計(jì)算架構(gòu),包括高通 Hexagon 處理器、Adreno GPU、Kryo CPU 和傳感器中樞,共同支持在終端上快速而有效的運(yùn)行 AI 應(yīng)用程序。其關(guān)鍵核心 Hexagon 處理器擁有一系列創(chuàng)新,如提供專用供電系統(tǒng)、支持微切片推理、INT4精度、Transformer 網(wǎng)絡(luò)加速等,可結(jié)合高通 AI 軟件棧和 AI Studio 提供全棧 AI 能力和優(yōu)化手段,在行業(yè)內(nèi)率先在終端側(cè)支持 Stable Diffusion、ControlNet 等生成式 AI 用例,并可與云端協(xié)同打造適應(yīng)大模型時(shí)代的混合 AI 處理框架,從而助力AI體驗(yàn)創(chuàng)新和生態(tài)繁榮。


此外,侯紀(jì)磊介紹了AI在5G方面的應(yīng)用。在今年的世界移動(dòng)通信大會(huì)(MWC)上,高通發(fā)布了驍龍X75調(diào)制解調(diào)器及射頻系統(tǒng),引入了第二代高通5G AI套件,包括專用張量加速器。同時(shí),據(jù)侯紀(jì)磊介紹,高通AI團(tuán)隊(duì)也與無(wú)線團(tuán)隊(duì)一直保持非常緊密的深入合作,從而能夠保證將研究成果更快推向商用。比如通過AI技術(shù)進(jìn)行毫米波波束管理,擴(kuò)毫米波通信的覆蓋范圍;通過AI輔助GPS定位,提升定位的精準(zhǔn)度等。


“目前,高通已經(jīng)形成了在邊緣側(cè)的布局和規(guī)?;膬?yōu)勢(shì)。搭載驍龍和高通平臺(tái)的用戶終端數(shù)量已經(jīng)達(dá)到數(shù)十億臺(tái)。每年有數(shù)億臺(tái)搭載驍龍和高通平臺(tái)的終端進(jìn)入市場(chǎng)。我們的AI能力賦能一系列廣泛的產(chǎn)品,包括手機(jī)、汽車、XR、PC和物聯(lián)網(wǎng)設(shè)備。”侯紀(jì)磊說(shuō)。


持續(xù)推進(jìn)支持百億參數(shù)大模型


去年年底,由ChatGPT引發(fā)的生成式AI浪潮席卷全球,而在生成式AI方面,高通于數(shù)年前便開始著手布局。


侯紀(jì)磊認(rèn)為,生成式AI將影響各類終端上的應(yīng)用場(chǎng)景。比如XR方面,基于簡(jiǎn)單提示,創(chuàng)造沉浸式的3D虛擬世界;汽車方面,擁有先進(jìn)駕駛輔助系統(tǒng)/自動(dòng)駕駛,通過預(yù)測(cè)不同行為主體的軌跡和行為,幫助改進(jìn)駕駛策略;在手機(jī)方面,成為真正的數(shù)字助手;在PC端,通過撰寫電子郵件,創(chuàng)建演示文稿和編寫代碼,變革生產(chǎn)力;在物聯(lián)網(wǎng)方面,有助于提升顧客和員工體驗(yàn),比如提供庫(kù)存和商店貨架排列推薦等。


今年的MWC上,高通的第二代驍龍8移動(dòng)平臺(tái)已經(jīng)可以支持參數(shù)超過10億的AI模型運(yùn)行,并進(jìn)行了全球首次端側(cè)運(yùn)行超過10億參數(shù)模型的演示。對(duì)于端側(cè)能夠有效支持的模型規(guī)模,侯紀(jì)磊認(rèn)為,在廣泛的用例中有很多基于10億參數(shù)為單位,從10億到100億便能夠涵蓋相當(dāng)多數(shù)的生成式AI,并能夠提供非常好的效果。據(jù)侯紀(jì)磊介紹,未來(lái)幾個(gè)月內(nèi),高通有望支持參數(shù)超過 100 億的模型在終端側(cè)運(yùn)行,明年將能夠支持參數(shù)超過200億的模型。此外通過全棧式的AI優(yōu)化,未來(lái)也將進(jìn)一步縮短大模型的推理時(shí)間。


侯紀(jì)磊指出,云經(jīng)濟(jì)難以支持生成式AI的規(guī)?;l(fā)展。如基于傳統(tǒng)方法和生成式AI的網(wǎng)絡(luò)搜索,單次查詢成本將是傳統(tǒng)的10倍,如果再疊加眾多的生成式AI應(yīng)用以及數(shù)十億的用戶基數(shù),這將在云端帶來(lái)顯著的負(fù)擔(dān)。因此,推動(dòng)端側(cè)和云端互補(bǔ)的混合AI,將是未來(lái)推動(dòng)生成式AI落地的顯著趨勢(shì)。


“未來(lái)場(chǎng)景中有中心云、邊緣云、有終端側(cè),AI處理中心在一定程度上可以向邊緣發(fā)展,因此混合AI是未來(lái)能夠支持生成式AI、大語(yǔ)言模型等實(shí)現(xiàn)全球化、規(guī)?;l(fā)展的重要手段。這個(gè)過程中,在包括無(wú)線連接、高效計(jì)算、分布式AI等方面,高通都能夠通過與業(yè)界的合作帶來(lái)更多創(chuàng)新?!焙罴o(jì)磊說(shuō)。


1689680694890489.jpg


侯紀(jì)磊指出,對(duì)于混合AI的部署,當(dāng)終端側(cè)具備強(qiáng)大生成式AI能力的時(shí)候,可以作為一個(gè)“錨點(diǎn)”。比如幫助工程師生成代碼,高通的愿景是未來(lái)一兩年內(nèi),在100-200億參數(shù)的范圍內(nèi),能夠使得大量工程師在端側(cè)進(jìn)行代碼撰寫。端側(cè)AI作為智能“錨點(diǎn)”發(fā)揮指揮或協(xié)調(diào)的作用,可以將合格的代碼交給開發(fā)者,不理想的生成代碼指令再交給云端進(jìn)一步處理,從而帶給用戶無(wú)縫體驗(yàn)。


1689680681373261.jpg


“終端側(cè)AI具有諸多優(yōu)勢(shì),是讓AI無(wú)處不在的關(guān)鍵?;旌螦I是AI的未來(lái),而我們的終端側(cè)AI領(lǐng)導(dǎo)力將支持生成式AI規(guī)?;瘮U(kuò)展?!焙罴o(jì)磊最后強(qiáng)調(diào)。


作者:集微網(wǎng),來(lái)源:雪球



免責(zé)聲明:本文為轉(zhuǎn)載文章,轉(zhuǎn)載此文目的在于傳遞更多信息,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請(qǐng)聯(lián)系小編進(jìn)行處理。


推薦閱讀:


納芯微容隔技術(shù),從容應(yīng)對(duì)電源難題

固體放電管雷擊應(yīng)用優(yōu)勢(shì)

真實(shí)環(huán)境中的GNSS/GPS干擾和欺騙測(cè)試

不同殼溫下SOA曲線的計(jì)算方法

這款高效、快速瞬態(tài)響應(yīng)的直通升壓控制器,你可能用得到

特別推薦
技術(shù)文章更多>>
技術(shù)白皮書下載更多>>
熱門搜索
?

關(guān)閉

?

關(guān)閉