中商情報網(wǎng)訊:7月4日,百度創(chuàng)始人兼董事長李彥宏在BaiduCrea-te2018百度AI開發(fā)者大會上正式發(fā)布百度自研的中國第一款云端全功能AI芯片“昆侖”,其中包含訓練芯片昆侖818-300,推理芯片昆侖818-100。
目前適合深度學習的人工智能芯片主要有GPU、FPGA、ASIC三種技術(shù)路線。三類芯片代表分別有英偉達(NVIDIA)的Tesla系列GPU、賽靈思(Xilinx)的FPGA和Google的TPU。GPU最先被引入深度學習,技術(shù)最為成熟;FPGA具有硬件可編程特點,性能出眾但壁壘高。ASCI由于可定制、低成本是未來終端應用的趨勢。
1、DPU
GPU使用SIMD(單指令多數(shù)據(jù)流)來讓多個執(zhí)行單元以同樣的步伐來處理不同的數(shù)據(jù),原本用于處理圖像數(shù)據(jù),但其離散化和分布式的特征,以及用矩陣運算替代布爾運算適合處理深度學習所需要的非線性離散數(shù)據(jù)。作為加速器的使用,可以實現(xiàn)深度學習算法。
GPU由并行計算單元和控制單元以及存儲單元構(gòu)成GPU擁有大量的核(多達幾千個核)和大量的高速內(nèi)存,擅長做類似圖像處理的并行計算,以矩陣的分布式形式來實現(xiàn)計算。同CPU不同的是,GPU的計算單元明顯增多,特別適合大規(guī)模并行計算。
GPU與CPU的比較
資料來源:中商產(chǎn)業(yè)研究院
2、FPGA
FPGA是用于解決專用集成電路的一種方案。專用集成電路是為特定用戶或特定電子系統(tǒng)制作的集成電路。人工智能算法所需要的復雜并行電路的設(shè)計思路適合用FPGA實現(xiàn)。FPGA計算芯片布滿“邏輯單元陣列”,內(nèi)部包括可配置邏輯模塊,輸入輸出模塊和內(nèi)部連線三個部分,相互之間既可實現(xiàn)組合邏輯功能又可實現(xiàn)時序邏輯功能的獨立基本邏輯單元。
FPGA相對于CPU與GPU有明顯的能耗優(yōu)勢,主要有兩個原因。首先,在FPGA中沒有取指令與指令譯碼操作,在Intel的CPU里面,由于使用的是CISC架構(gòu),僅僅譯碼就占整個芯片能耗的50%;在GPU里面,取指令與譯碼也消耗了10%~20%的能耗。其次,F(xiàn)PGA的主頻比CPU與GPU低很多,通常CPU與GPU都在1GHz到3GHz之間,而FPGA的主頻一般在500MHz以下。如此大的頻率差使得FPGA消耗的能耗遠低于CPU與GPU。
3、ASIC
ASIC(專用定制芯片)是為實現(xiàn)特定要求而定制的芯片,具有功耗低、可靠性高、性能高、體積小等優(yōu)點,但不可編程,可擴展性不及FPGA,尤其適合高性能/低功耗的移動端。
目前,VPU和TPU都是基于ASIC架構(gòu)的設(shè)計。針對圖像和語音這兩方面的人工智能定制芯片,目前主要有專用于圖像處理的VPU,以及針對語音識別的FAGA和TPU芯片。
圖像應用和語音應用人工智能定制芯片
資料來源:中商產(chǎn)業(yè)研究院
我國人工智能芯片行業(yè)正處于起步階段
目前,我國的人工智能芯片行業(yè)發(fā)展尚處于起步階段。華為在2017年德國柏林國際消費類電子產(chǎn)品展覽會發(fā)布華為首款人工智能(AI)移動計算平臺——麒麟970,是業(yè)界首顆帶有獨立NPU(神經(jīng)網(wǎng)絡(luò)單元)的手機芯片,是華為人工智能的重要里程碑,也是中國芯片設(shè)計行業(yè)的重要里程碑。
我國人工智能芯片行業(yè)規(guī)模分析
隨著大數(shù)據(jù)的發(fā)展,計算能力的提升,人工智能近兩年迎來了新一輪的爆發(fā)。芯片約占人工智能比重的15%,結(jié)合我國人工智能市場規(guī)模,推算出2016年我國人工智能芯片市場規(guī)模約為20億元。
數(shù)據(jù)來源:中商產(chǎn)業(yè)研究院
我國人工智能芯片行業(yè)區(qū)域發(fā)展分析
據(jù)工信部統(tǒng)計,中國北上深三座城市的人工智能相關(guān)企業(yè)總數(shù)達447家,攀升速度迅猛。目前,幾乎所有互聯(lián)網(wǎng)企業(yè)的互聯(lián)網(wǎng)產(chǎn)品,都會或多或少加入算法和深度學習的功能,AI正在成為中國互聯(lián)網(wǎng)公司的標配。
資料來源:中商產(chǎn)業(yè)研究院
以上數(shù)據(jù)及分析均來源于中商產(chǎn)業(yè)研究院《2018-2023年中國人工智能芯片行業(yè)市場前景及投資機會研究報告》