你的位置:首頁 > 傳感技術(shù) > 正文

選擇AI處理器離不開的“三項(xiàng)原則”

發(fā)布時(shí)間:2019-12-19 責(zé)任編輯:lina

【導(dǎo)讀】移動(dòng)設(shè)備上的人工智能已經(jīng)不再依賴于云端連接,今年 CES 最熱門的產(chǎn)品演示和最近宣布的旗艦智能手機(jī)都論證了這一觀點(diǎn)。人工智能已經(jīng)進(jìn)入終端設(shè)備,并且迅速成為一個(gè)市場賣點(diǎn)。
  
移動(dòng)設(shè)備上的人工智能已經(jīng)不再依賴于云端連接,今年 CES 最熱門的產(chǎn)品演示和最近宣布的旗艦智能手機(jī)都論證了這一觀點(diǎn)。人工智能已經(jīng)進(jìn)入終端設(shè)備,并且迅速成為一個(gè)市場賣點(diǎn)。包括安全、隱私和響應(yīng)時(shí)間在內(nèi)的這些因素,使得該趨勢必將繼續(xù)擴(kuò)大到更多的終端設(shè)備上。為了滿足需求,幾乎每個(gè)芯片行業(yè)的玩家都推出了不同版本、不同命名的人工智能處理器,像“深度學(xué)習(xí)引擎”、“神經(jīng)處理器”、“人工智能引擎”等等。
 
說起人工智能好像我們想到的是機(jī)器視覺,指紋識別,人臉識別,視網(wǎng)膜識別,虹膜識別,掌紋識別,自動(dòng)規(guī)劃,智能搜索,博弈,自動(dòng)程序設(shè)計(jì),智能控制等;然而其核心內(nèi)容是離不開嵌入式的。
 
然而,并非所有的人工智能處理器都是一樣的?,F(xiàn)實(shí)是,許多所謂的人工智能引擎就是傳統(tǒng)的嵌入式處理器加上一個(gè)矢量向量處理單元。這里還有一些其它功能對于人工智能處理前端化至關(guān)重要。
 
優(yōu)化嵌入式系統(tǒng)的工作負(fù)載
 
在云計(jì)算處理過程中,采用浮點(diǎn)計(jì)算進(jìn)行訓(xùn)練,定點(diǎn)計(jì)算進(jìn)行推理,從而實(shí)現(xiàn)最大的準(zhǔn)確性。用大型服務(wù)器群組進(jìn)行數(shù)據(jù)處理,能耗和大小必須考慮,但他們相較于有邊緣約束的處理幾乎是無限的。
 
在移動(dòng)設(shè)備上,功耗、性能和面積(PPA)的可行性設(shè)計(jì)至關(guān)重要。因此在嵌入式 SoC 芯片上,優(yōu)先采用更有效的定點(diǎn)計(jì)算。
 
選擇AI處理器離不開的“三項(xiàng)原則”
   
當(dāng)將網(wǎng)絡(luò)從浮點(diǎn)轉(zhuǎn)換為定點(diǎn)時(shí),會不可避免地?fù)p失掉一些精度。然而正確的設(shè)計(jì)可以優(yōu)化精度損失,從而達(dá)到與原始訓(xùn)練網(wǎng)絡(luò)幾乎相同的結(jié)果。
 
控制精度的方法之一是在 8 位和 16 位整數(shù)精度之間做出選擇。雖然 8 位精度可以節(jié)省帶寬和計(jì)算資源,但是許多商用的神經(jīng)網(wǎng)絡(luò)仍然需要采用 16 位精度以保證準(zhǔn)確性。
 
神經(jīng)網(wǎng)絡(luò)的每一層都有不同的約束和冗余,因此為每一層選擇更高的精度是至關(guān)重要的。
 
針對開發(fā)人員和 SoC 設(shè)計(jì)者,一個(gè)工具可以自動(dòng)輸出優(yōu)化的圖形編譯器和可執(zhí)行文件,例如 CEVA 網(wǎng)絡(luò)生成器,從上市時(shí)間的角度來看是一個(gè)巨大的優(yōu)勢。
 
此外,保持為每一層選擇更高精度(8 位或 16 位)的靈活性也是很重要的。這使每一層都可以在優(yōu)化精度和性能之間進(jìn)行權(quán)衡,然后一鍵生成高效和精確的嵌入式網(wǎng)絡(luò)推理。
 
 選擇AI處理器離不開的“三項(xiàng)原則”
 
專用硬件來處理真正的人工智能算法
 
VPU 使用靈活,但許多常見的神經(jīng)網(wǎng)絡(luò)需要的大量帶寬通道對標(biāo)準(zhǔn)處理器指令集提出了挑戰(zhàn)。因此,必須有專門的硬件來處理這些復(fù)雜的計(jì)算。
 
例如 NeuPro AI 處理器包括專用的引擎處理矩陣乘法、完全連接層、激活層和匯聚層。這種先進(jìn)的專用 AI 引擎結(jié)合完全可編程工作的 NeuPro VPU,可以支持所有其它層類型和神經(jīng)網(wǎng)絡(luò)拓?fù)洹?/div>
 
這些模塊之間的直接連接允許數(shù)據(jù)無縫交換,不再需要寫入內(nèi)存。此外,優(yōu)化的 DDR 帶寬和先進(jìn)的 DMA 控制器采用動(dòng)態(tài)流水線處理,可以進(jìn)一步提高速度,同時(shí)降低功耗。
 
 選擇AI處理器離不開的“三項(xiàng)原則”
 
明天未知的人工智能算法
 
人工智能仍然是一個(gè)新興且快速發(fā)展的領(lǐng)域。神經(jīng)網(wǎng)絡(luò)的應(yīng)用場景快速增加,例如目標(biāo)識別、語音和聲音分析、5G 通信等。保持一種適應(yīng)性的解決方案,滿足未來趨勢是確保芯片設(shè)計(jì)成功唯一途徑。
 
因此,滿足現(xiàn)有算法的專用硬件肯定是不夠的,還必須搭配一個(gè)完全可編程的平臺。在算法一直不斷改進(jìn)的情況下,計(jì)算機(jī)模擬仿真是基于實(shí)際結(jié)果進(jìn)行決策的關(guān)鍵工具,并且減少了上市時(shí)間。
 
CDNN PC 仿真包允許 SoC 設(shè)計(jì)人員在開發(fā)真實(shí)硬件之前,就可以使用 PC 環(huán)境權(quán)衡自己的設(shè)計(jì)。
 
選擇AI處理器離不開的“三項(xiàng)原則”
 
另一個(gè)滿足未來需求的寶貴特征是可擴(kuò)展性。NeuPro AI 產(chǎn)品家族可以應(yīng)用于廣泛的目標(biāo)市場,從輕量型的物聯(lián)網(wǎng)和可穿戴設(shè)備(2 TOPs)到高性能的行業(yè)監(jiān)控和自動(dòng)駕駛應(yīng)用(12.5 TOPs)。
 
在移動(dòng)端實(shí)現(xiàn)旗艦 AI 處理器的競賽已經(jīng)開始。 許多人快速趕上了這一趨勢,使用人工智能作為自己產(chǎn)品的賣點(diǎn),但并不是所有產(chǎn)品里都具備相同的智能水平。
 
如果想要?jiǎng)?chuàng)建一個(gè)在不斷發(fā)展的人工智能領(lǐng)域保持“聰明”的智能設(shè)備,應(yīng)該確保在選擇 AI 處理器時(shí),檢查上述提到的所有特性。
 
 
推薦閱讀:
一文讀懂光幕傳感器及其工作原理和使用方法
解析各類加速度傳感器的工作原理
為何PCB多層板都是偶數(shù)層?奇數(shù)層不行嗎?
PCIM Asia 2020國際研討會論文征集及講者招募火熱進(jìn)行中
12月CEE2020北京電子煙展年末感恩禮冰點(diǎn)價(jià)參展瘋搶最后30天
要采購工具么,點(diǎn)這里了解一下價(jià)格!
特別推薦
技術(shù)文章更多>>
技術(shù)白皮書下載更多>>
熱門搜索
?

關(guān)閉

?

關(guān)閉