深圳2018年3月8日電 /美通社/ -- 終端人工智能解決方案領導企業(yè)耐能 (Kneron) 正式發(fā)布 Kneron NPU IP 神經(jīng)網(wǎng)絡處理器系列 (Kneron NPU IP Series),是針對終端設備所設計的專用人工智能處理器 IP。Kneron NPU IP 系列包括三款產(chǎn)品,分別為超低功耗版 KDP 300、標準版 KDP 500、以及高效能版 KDP 700,可滿足智能家居、智能安防、智能手機,以及各種物聯(lián)網(wǎng)設備的應用。全系列產(chǎn)品具備低功耗、體積小的特性,且提供強大的運算能力。別于市面上用于人工智能的處理器,其功耗動輒數(shù)瓦起,Kneron NPU IP 的功耗為100毫瓦 (mW) 等級,針對智能型手機臉部識別專用的 KDP 300,功耗甚至不到5毫瓦(注一)。
Kneron 創(chuàng)始人暨 CEO 劉峻誠表示:「要在終端設備上進行人工智能運算,同時滿足功耗與效能需求是首要考慮,Kneron NPU IP 實現(xiàn)了這樣的目標,為終端人工智能帶來革命性的發(fā)展。Kneron 自2016年推出該公司首款終端設備專用的人工智能處理器 NPU IP 后,就不斷改善其設計與規(guī)格,并針對不同產(chǎn)業(yè)應用進行優(yōu)化。我們很高興推出全系列新一代產(chǎn)品,同時宣布 KDP 500 已獲得客戶采用,于第二季進入量產(chǎn)制造 (Mask tape-out) 階段?!?/p>
Kneron NPU IP 是針對終端設備所設計的專用人工智能處理器,讓終端設備在離線環(huán)境下,就能運行 ResNet、YOLO 等深度學習網(wǎng)絡。Kneron NPU 為完整的終端人工智能硬件解決方案,包含硬件 IP、編譯程序 (Compiler) 以及模型壓縮 (Model compression) 三大部分,可支持各種主流的卷積神經(jīng)網(wǎng)絡 (Convolutional Neur al Networks,CNN) 模型,如 Resnet-18、Resnet-34、Vgg16、GoogleNet、以及 Lenet 等,以及支持主流深度學習框架,包括 Caffe、Keras 和 TensorFlow。
Kneron NPU IP 功耗為100毫瓦等級,超低功耗版的 KDP 300 甚至不到5毫瓦,全系列產(chǎn)品的每瓦效能在1.5 TOPS/W以上(注二),由于采用了多項獨家技術,因此能實現(xiàn)低功耗、高運算力的需求。在架構設計上,運用卷積核拆分 (Filter decomposition) 技術,將大卷積核的卷積運算區(qū)塊分割成多個小卷積運算區(qū)塊分別進行運算,然后結合可重組硬件卷積加速 (Reconfigurable Convolution Acceleration) 技術,將多個小卷積運算區(qū)塊的運算結果進行融合,以加速整體運算效能。通過 Kneron 先進的壓縮技術,則能將未經(jīng)優(yōu)化的模型壓縮數(shù)十倍。內(nèi)存分層儲存技術 (Multi-level caching) 可減少占用 CPU 資源以及降低數(shù)據(jù)傳輸量,進一步提升整體運作效率。此外,Kneron NPU IP 能結合 Kneron 影像識別軟件,提供實時識別分析、快速響應,不僅更穩(wěn)定,也能滿足安全隱私需求。由于軟硬件可緊密整合,讓整體方案體積更小、功耗更低,以協(xié)助產(chǎn)品快速開發(fā)。
Kneron NPU IP 產(chǎn)品系列介紹:
1. NPU IP- KDP 300 低功耗版
鎖定手機3D臉部識別應用,可進行3D結構光與來自雙鏡頭的立體影像識別分析,讓真人臉部識別更快速精準。KDP 300 亦適用于需要超低功耗的終端設備,該處理器包含運算與靜態(tài)隨機存取內(nèi)存 (SRAM) 的功耗不到5毫瓦。
2. NPU IP- KDP 500 標準版
可進行快速實時、大規(guī)模的臉部、手勢、身體識別與分析,以及深度學習。適用于智能家居、智能安防等領域。運算能力可達152 GOPS (500MHz) (每秒十億次運算),功耗僅有100毫瓦。
3. NPU IP- KDP 700 高效能版
能處理更進階與復雜的人工智能運算,以及深度學習推理應用,可應用在高階智能型手機、機器人、無人機、智能監(jiān)控設備等。KDP 700 具有優(yōu)異的運算能力,信息吞吐量可高達4.4 TOPS (1GHz) (每秒萬億次運算),功耗為300~500毫瓦。
注一:應用條件為 CNN slice size 150x150、CNN frame rate 5fps、main frequency 20Mhz 的計算結果。 |