邊緣AI晶片的市場規模預計將在2025年第一次超越雲端AI晶片市場。國際科技市場資訊公司,ABI Research的資料顯示,邊緣AI晶片市場營收將在2025達到122億美元,超越雲端AI晶片市場的119億美元營收額。邊緣AI的應用範圍包括智慧手機、可穿戴設備、智慧汽車、智慧家居、智慧工業,以及智慧城市等。其中,智慧家居是邊緣AI市場發揮最主要的應用。
此前大多數AI的工作負載都在公有雲端或者私有雲端上進行。傳統上,將工作負載集中上傳到雲端上進行,更具靈活性。然而,由於對隱私、網路安全以及低延遲的需求,在閘道、設備端以及感測器上執行AI邏輯推理成為了首要選擇。在這領域的最關鍵進展包括了新的AI學習架構以及高性能計算晶片組,在這一轉變中發揮了重要作用。
邊緣AI盡可能使用實體系統來進行資料計算,其優點是資料處理過程不需要連接網路。邊緣計算發生在網路的邊緣,即資料的產生端,而不是在集中的資料處理中心。邊緣AI的最大優勢之一就是可確保對時間敏感的需求應用得到即時結果。在許多應用場景,感測器的資料可以被直接收集交流以及通信,而無需將資料傳輸到對時間敏感的雲端資料處理中心。
深度學習除了應用在智慧手機以外,也被廣泛應用在物聯網設備中(智慧物聯網)。邊緣AI為傳統物聯網領域引入了全新概念。然而,作為物聯網設備的傳統運算單元,MCU的計算能力較弱不足以支持其進行深度學習。目前,有兩種硬體機制來輔助MCU進行深度學習:DSP或專用加速器(Deep Neural Network/DNN)。此硬體機制可作為IP或者晶片搭載於MCU之上。
卷積層以及全聯通層均使用DNN演算法,它們的基本組成部分是乘法和累加計算(MAC)。為了達到高性能,經常使用高度並行的計算方法。許多存儲在DRAM中的權重反覆運算都會根據不同的訓練模式進行更新。
不管上述機制如何,DRAM的輸送量都是DNN的關鍵。因此,選擇一個合適的DRAM成為了AIoT的核心問題。與雲端環境不同,在進行邊緣計算時需要考慮低功耗的問題。AIoT設備設計者必須尋求低功耗與高性能的平衡。除此之外,在AIoT設備中的DRAM容量需求與常規的8-16Gb/片不同,只需要1-2Gb。
AI處理器晶片市場的領導廠商耐能(Kneron)致力於為邊緣計算應用提供高效能系統晶片(SoC),旗下的KL720 SoC上搭載了華邦的1Gb LPDDR3 DRAM。此外,這並不是耐能與華邦的首次合作,此前推出的KL520搭載華邦的512Mb LPDDR2,多使用在智慧鎖和無人機等電池供電的應用。
華邦的LPDDR3 DRAM能支援耐能KL720的高處理量和效能效率,最高頻寬達8.5GB/s,可在雙1.2V/1.8V供電下運作,且能即時處理4K、Full HD或3D感測器的視頻影像,為家居安防攝影機的人臉識別、公用資訊站的手勢控制等AI應用提供支援。此外,該產品的1.4 TOPS效能甚至能同時支援即時視頻和自然語言處理。
除此之外,華邦的LPDDR3 DRAM低容量高頻寬的特性使其在汽車應用領域中也潛力巨大,例如高級駕駛輔助系統(ADAS),該系統需採用可進行即時視訊影像處理的鏡頭。同時,越來越多的物聯網終端設備也需要配備低容量,高頻寬的記憶體產品,使其能夠實現基本的人工智慧推理功能。
LPDDR4/4x x32具有LPDDR3和LPDDR2相同的優勢,但其頻寬輸送量幾乎可以達到LPDDR3的兩倍。在降低功耗方面,LPDDR4x的IO電壓為0.6(V),而LPDDR4為1.1(V)。雖然JEDEC已經發佈了最新的LPDDR5標準,但是剛剛上市的LPDDR5的容量仍然很高,無法應用於AIoT領域。因此目前,如果我們需要比LPDDR3更強大的人工智慧計算能力,LPDDR4x仍然是最佳選擇。
Fig.1
華邦電子擁有自建晶圓廠,是可同時提供DRAM和NOR/NAND快閃記憶體的四大IC製造商之一。華邦LPDDR4/4x DRAM系列的容量為1~4Gb,採用自主研發的25nm技術節點,I/O資料傳輸可達4266Mbps,同時除了常規標準外,目前提供標準200BGA封裝。