2016年,中星微發布首款深度學習芯片星光智能一號,核心技術為內置專為卷積神經網絡優化的神經網絡處理單元(NPU)。星光智能1號是中國首款量產的人工智能芯片,目前已經在9大領域落地開花去的應用成果。同時星光智能1號在2017年獲北京科技進步獎,是神經網絡處理器獲得的第一個獎。
張韻東介紹,第二代NPU的運算能力達到1080P@30fps實時分類檢測的需求,是第一代NPU的16,采用了獨特的網絡精簡技術,大幅地降低了數據吞吐量,進一步提升了芯片的能耗比和效率。
此外,第二代NPU大幅度增加了片上SRAM的容量,減少了內存帶寬上的壓力,整體效率比第一代有大幅度的提升,在低功耗性能上有了明顯的改善,通過改變微構架和動態控制內存以及運算單元的方式來降低芯片的整體功耗。
同時,也擴展了更多的神經網絡算法,軟件可以容易地編程并靈活使用。采用了分布式結構和并行計算的方式,可以實現更為靈活的硬件方案。
此款NPU針對CNN算法特點進行優化設計,采用全新的“數據驅動”的計算機架構,徹底顛覆了傳統的馮諾依曼架構。NPU針對神經網絡架構進行優化,可以靈活配置網絡結構,支持AlexNet、GoogLeNet等各類神經網絡。支持CAFFE和TENSORFLOW等主流深度學習軟件開發框架,可以輕松將深度學習算法應用于嵌入式產品。