東芝電子元件及存儲裝置株式會社(“東芝”)今日宣布成功開發(fā)出一款汽車應(yīng)用圖像識別系統(tǒng)級芯片(SoC),與東芝上一代產(chǎn)品相比,該產(chǎn)品使深度學(xué)習(xí)加速器的速度提升10倍,功率效率提高4倍[1]。該技術(shù)成果的詳情于2月19日在舊金山舉行的2019 IEEE國際固態(tài)電路會議(ISSCC)上公諸于眾。
自動緊急剎車等先進(jìn)駕駛員輔助系統(tǒng)可提供越來越先進(jìn)的功能,但實(shí)現(xiàn)這些功能需要圖像識別系統(tǒng)級芯片在低功耗條件下高速識別道路交通信號和路況。
深度神經(jīng)網(wǎng)絡(luò)(DNN)是模仿大腦神經(jīng)網(wǎng)絡(luò)的算法,與傳統(tǒng)模式識別和機(jī)器學(xué)習(xí)相比,DNN的識別處理精度要高得多,預(yù)計(jì)將會在汽車應(yīng)用領(lǐng)域得到廣泛應(yīng)用。而采用傳統(tǒng)處理器的DNN圖像識別耗時(shí)較長,因?yàn)樗蕾嚧罅康某朔e累加(MAC)計(jì)算。同時(shí),采用傳統(tǒng)高速處理器的DNN還存在功耗過高問題。
東芝利用可在硬件上實(shí)現(xiàn)深度學(xué)習(xí)的DNN加速器解決了這一難題。它具有三大特點(diǎn)。
- 并行MAC單元。DNN處理需要大量MAC計(jì)算。東芝的新設(shè)備配有四個(gè)處理器,每個(gè)處理器包含256個(gè)MAC單元。因此提高了DNN的處理速度。
- 減少了動態(tài)隨機(jī)存取存儲器(DRAM)存取。傳統(tǒng)的系統(tǒng)級芯片沒有本地內(nèi)存,無法在靠近DNN執(zhí)行單元的位置保存臨時(shí)數(shù)據(jù),并且在訪問本地內(nèi)存時(shí)產(chǎn)生較大功耗。同時(shí),加載用于MAC計(jì)算的加權(quán)數(shù)據(jù)也會產(chǎn)生較大功耗。東芝新設(shè)備可在DNN執(zhí)行單元附近執(zhí)行靜態(tài)隨機(jī)存取存儲器(SRAM),并將DNN處理分為多個(gè)子處理塊,因此可將臨時(shí)數(shù)據(jù)保存在SRAM內(nèi),從而減少了DRAM存取。此外,東芝還在加速器上增加了一個(gè)解壓縮單元。可通過解壓縮單元加載預(yù)先壓縮并存儲在DRAM中的加權(quán)數(shù)據(jù)。因此,降低了加載來自DRAM的加權(quán)數(shù)據(jù)時(shí)產(chǎn)生的功耗。
- 減少了SRAM存取。傳統(tǒng)深度學(xué)習(xí)需要在處理DNN的每一層之后訪問DRAM,因此功耗過高。該加速器在DNN的DNN執(zhí)行單元中設(shè)計(jì)有流水線層結(jié)構(gòu),以便在一次SRAM存取期間執(zhí)行一系列DNN計(jì)算。
新系統(tǒng)級芯片符合全球汽車應(yīng)用功能安全標(biāo)準(zhǔn)ISO26262的要求。
東芝將繼續(xù)提高所開發(fā)的系統(tǒng)級芯片的功率效率和處理速度,且東芝下一代圖像識別處理器ViscontiTM5的樣品發(fā)貨將于今年九月啟動。
注
|
[1]
|
|
東芝在2015 IEEE國際固態(tài)電路會議上發(fā)表的一篇論文《面向圖像識別應(yīng)用采用基于顏色的對象分類加速器的1.9TOPS與564GOPS/W異構(gòu)多核系統(tǒng)級芯片》中提及的圖像識別系統(tǒng)級芯片
|