從PC到移動,再到如今火爆的AI領域,芯片始終決定著企業的行業競爭力和話語權。
然而,無論是獨霸PC時代的英特爾,還是把持移動端的ARM、高通,對于布局AI芯片這一新興領域,都顯得有些吃力。同樣,即便是憑借GPU牢牢占據云端AI芯片頭把交椅的英偉達,在科技巨頭和新秀們的“圍剿”面前,仍然有翻車的危險。
歸根到底,AI芯片這一全新的領域,根本不存在無法逾越的“護城河”。
如今,谷歌、蘋果、亞馬遜、Facebook以及華為、阿里、百度等國內外巨頭紛紛涉足其中,群雄逐鹿,究竟誰能染指這個“香餑餑”?
帝國重器
眾所周知,AI的發展離不開三大元素:算法、算力和數據。其中算法、算力都與芯片密不可分,其重要性自然不言而喻。因此,AI芯片就猶如“帝國重器”一般,成為各大廠商爭奪的目標。
那何為AI芯片呢?它與傳統PC和移動芯片的區別何處?
從廣義上來說,AI芯片就是能執行AI算法的芯片。理論上,目前CPU、GPU等通用芯片都可以執行AI算法,只是效率、功耗上存在差異。從狹義上來說,AI芯片被定義為針對AI算法進行加速的專用芯片,也就是AI加速芯片或AI加速器。
顯然,由于通用型的芯片需要適應各種應用程序的需要,在執行AI算法時,效率自然不及專用的AI芯片,同時也難以控制功耗,性價比不高。而且,由于面向專用算法,AI芯片一般都側重于特定領域,例如語音識別、自然語言處理、圖像處理、自動駕駛等等,針對性較強。所以,傳統PC和移動芯片的區別,就在于是否能為AI算法加速。
關于AI芯片的類別,需要從構架、功能和場景三個維度來看。
首先,從構架來說,第一類是通用芯片,即GPU(Graphics Processing Unit,圖像處理單元),代表廠商就是英偉達、英特爾和AMD,其中英特爾在GPU集群上優勢明顯;第二類是FPGA(Field-Programmable Gate Array),即現場可編程門陣列,就是一種半定制的芯片,特點是可編程,目前賽靈思(XILINX)、Altera兩家占據了近90%的市場份額;第三類則是ASIC(Application Specific Integrated Circuit),即專用集成電路,是一種全定制化芯片,例如谷歌TPU、華為kirin系列等;第四類是類腦芯片,IBM的TrueNorth最具代表性,但離商業化落地還很遙遠,就不過多提及了。
值得注意的是,ASIC還衍生出NPU(神經網絡處理器),其專為深度學習設計,英特爾NNP、寒武紀NPU及華為麒麟系列等都是典型的代表。此外,在ASIC的基礎上,一些廠商還通過SoC+IP 模式,在一塊芯片上整合不同功能或者IP(半導體知識產權),也可以稱之為系統級芯片。其目的就是在有限的體積內實現密度的最大化,以提升芯片的性價比和移動性。
其次,從功能上來說,由于AI的機器學習和深度學習都離不開Training(訓練)和Inference(推理)兩大環節。所謂訓練,就是憑借大數據讓機器形成一個復雜的神經網絡算法模型。而推理則是通過該算法模型,讓機器模仿人做出推理或決策。在訓練方面,英偉達的GPU領先優勢相當明顯,幾乎成為標配。此外,英特爾、AMD 、賽靈思、谷歌等都有相應的解決方案。
推理方面,英偉達優勢不在,除了英特爾、谷歌、賽靈思等芯片大廠之外,科技巨頭亞馬遜、微軟、百度、阿里、騰訊、新興的寒武紀、地平線,以及移動端的高通、華為海思、ARM等也涉足其中,競爭之激烈可見一斑。
然后,從場景來看,AI芯片又分為云端和終端兩類。由于訓練需要龐大的數據量和高強度的運算量,單一處理器根本無法獨立完成,必須通過云端借助龐大的云端神經網絡才行。而在終端方面,各種智能終端可謂天差地別,尤其是移動端,為了滿足用戶越來越苛刻的要求以及增強體驗,就必須配備執行效率高的推理芯片,同時要兼具體積小巧及低功耗,要求也提升不少。
另外,業內還有許多不同的芯片構架和概念,這里就不一一列舉,但無論是GPU、FPGA、ASIC,還是NPU、TPU之類,歸根到底,就是為了實現AI算法效率的最大化,加強競爭力。
目前,全球AI芯片行業中,GPU可謂一枝獨秀,FPGA和ASIC則奮力追趕,盡管各有優缺點,但各自陣營都有鮮明的特點,例如GPU的性能強大、通用性強,功耗也巨大;FPGA可編程,靈活性和性能不錯,但價格過高;ASIC可定制,性能穩定,功耗也可控,但研發周期長、風險高。
大國爭霸
傳統顯示設備巨頭英偉達在AI芯片領域的崛起,看似無心插柳柳成蔭,但從深層次來說,也是其始終專注GPU而結出的碩果。
GPU以往主要用于圖形和視頻處理領域,能夠處理復雜且多數據處理,而正因此,其在性能方面大大優于CPU,同時輔以CUDA(Compute Unified Device Architecture,即通用并行計算架構),使其在AI領域如虎添翼,尤其在云端訓練上得到應用廣泛,促使英偉達在該領域一枝獨秀。
目前,各大AI廠商和云計算數據中心基本都配備英偉達GPU集群,構建超算中心,用于大規模的訓練,以支撐AI業務和應用場景的運作。
除此之外,英偉達還為自動駕駛、機器人、醫療等行業提供相應的AI解決方案。典型的例子就是,特斯拉在推出自有芯片之前,采用的就是英偉達的解決方案。
與此同時,傳統PC芯片“大哥大”英特爾與其老對手AMD也在積極向AI芯片方向拓展,但無奈CPU在算法上執行效率不高,GPU性能又不及英偉達,所以只得尋求新的機會。其中英特爾借助收購FPGA生產商Altera和機器視覺廠商Movidus,以涉足FPGA、 ASIC構架新領域,在數據中心市場加大布局力度。同時,還有傳言英特爾也在積極研發新一代GPU產品。而AMD則仍然依托自有GPU的優勢,是GPU的第二大市場,其定位也是數據中心。
IBM在芯片領域始終比較超前,除了前沿的類腦芯片之外,IBM 旗下Research AI團隊還用大規模的模擬存儲器陣列訓練深度神經網絡(DNN),已達到了與GPU相當的精度。
FPGA構架的“締造者”賽靈思在AI芯片領域早已有了布局。2018年,賽靈思推出一款超越FPGA功能的新產品——ACAP(自適應計算加速平臺)和Versal芯片,樹起FPGA反擊的大旗。
作為移動芯片領域的霸主,高通也推出了云端AI芯片Cloud AI 100加速器,針對數據中心。據悉,預計將于2019年下半年開始向客戶出樣。
目前,雖然移動端并非AI芯片競爭的主戰場,但ARM、高通、三星仍然在AI芯片上做文章,通過SoC+IP 模式,形成CPU+AI芯片+5G基帶芯片一體化的全新芯片組,以降低體積和功耗,適應移動終端的需要。盡管,現在云端訓練芯片當道,但面向終端的推理芯片的需求也日益迫切,隨著智能手機新能的突飛猛進,移動AI芯片無疑將逐漸走向前臺。

據市場研究顧問公司Compass Intelligence在2018年5月發布的關于AI芯片調研報告顯示,英偉達當仁不讓成為領頭羊,英特爾和IBM緊隨其后。值得注意的是谷歌、蘋果排在第四、第五的位置,顯然已經開始挑戰傳統芯片廠商的地位。此外,AMD、ARM、高通、三星、恩智浦仍然占據位列前十。博通、新思(Synopsys)、Marvell、賽靈思等老牌芯片廠商也排在前25位之中。
而令國人鼓舞的是,國內有7家廠商上榜,其中華為海思排名第12位,聯發科為第14位;兩家初創企業寒武紀(Cambricon)和地平線(Horizon)排名第23位和24位。余下的Imagination(原英國芯片廠商,已被中資收購)、瑞芯微(Rockchip)、芯原(Verisilcon)三家的知名度并不高,可謂“隱形冠軍”。
但毋庸置疑的是,目前全球AI芯片領域仍然呈現于“大國爭霸”的局面,以英偉達、英特爾、IBM、ARM、高通、三星等為首的老牌芯片廠商依舊占據市場主動。同時,以谷歌、蘋果等為代表的新興勢力和初創企業崛起的勢頭也難以阻擋。
實際上,僅僅從芯片的構架就能發現端倪。老牌廠商在傳統優勢構架在基礎上向全新領域拓展,而新興廠商則直接轉向可定制的全新解決方案, 其中ASIC構架正是趁著這一勢頭迅速升溫。當然,其背后離不開大量新興芯片廠商的推波助瀾,AI芯片行業至此呈現出“百家爭鳴“的新態勢。
百家爭鳴
在老牌芯片廠商尋求新突破方向的時候,兩股“造芯新勢力”開始脫穎而出。首先是以谷歌、蘋果、華為、阿里等為首的科技和互聯網巨頭開始涉足AI芯片領域,甚至特斯拉也舍棄英偉達的芯片解決方案,推出了自研的FSB全自動駕駛芯片。其次,初創AI企業早已崛起,寒武紀、地平線、依圖等新勢力接著資本風潮,也試圖進入芯片領域,以爭奪這一新興市場。
2016年,谷歌推出TPU(Tensor Processing Unit),基于ASIC構架,專為機器學習設計,配合自家深度學習框架TensorFlow,以加強算法模型的執行效率,并且同時可運用在訓練和推理上,適應性更強。值得注意的是,2016年名聲大噪的AlphaGo成功的背后,就離不開TPU芯片的支持。
2018年谷歌在Google I/O大會推出了TPU3.0,性能大幅提升。隨后,谷歌又接連推出面向云端的Cloud TPU和針對終端的Edge TPU兩款芯片,其目的就是挑戰英偉達GPU的霸主地位。
目前,憑借自身云計算的優勢,谷歌在云端AI芯片上的努力,已經給英偉達帶來了不小的沖擊。然而,英偉達在芯片領域擁有豐富的經驗和資源,且GPU具有先入為主的巨大優勢,通用性強,且牢牢占據市場主動,近期撼動其霸主地位顯然并不現實。
作為智能手機時代的開創者,蘋果在移動領域始終呼風喚雨。但是,蘋果在芯片上一直受制于人,顯然與其強勢的個性不符。所以,從2008年開始,蘋果就通過一系列收購,開始了自己的“造芯”之路。2017年9月,蘋果推出了全新的A11芯片,其采用ASIC構架,整合了一個專用于機器學習的神經網絡引擎(Apple Neural Engine)硬件,性能強大。2018年9月,蘋果又推出A12仿生芯片,AI能力再度加強。
與谷歌一樣,微軟和亞馬遜也在云計算領域具雄厚的實力。微軟代號為Project Catapult的FPGA構架AI芯片、亞馬遜云端AI芯片Inferentia均通過自研,以擺脫芯片廠商的束縛,提升自身云計算和相關應用的競爭力。
在國內互聯網企業中,百度在AI領域的拓展由來已久,并喊出「All in AI」的戰略目標。在繼“百度大腦”、深度學習框架PaddlePaddle、智能語音操作系統DuerOS和自動駕駛平臺Apollo之后,百度也推出了自研AI芯片——“昆侖”。據悉,“昆侖”基于百度CPU、GPU和FPGA加速器長達8年的研發,通過20多次的迭代產生。
最近名聲大振的華為海思,成立于2004年10月,其前身是創建于1991年的華為集成電路設計中心,可見華為的遠見。而在AI芯片方面,華為在云端、邊緣和移動端都有相應的解決方案。在移動端,先后推出了麒麟系列的Kirin970和Kirin980兩款AI芯片,從借鑒寒武紀NPU到自研首次集成雙NPU單元,AI性能大幅提升。
2018年10月,華為推出自研的達芬奇架構的昇騰系列AI芯片——Ascend 910和Ascend 310,昇騰910面向云端訓練和推理,直至競爭對手英偉達和谷歌,被稱之為當時單芯片計算密度最大的AI芯片。而Ascend 310為低功耗設計,針對邊緣計算,擁有nano、tiny、mini、lite和max五個系列,能提供橫跨全場景支持。至此,在AI芯片的支持下,華為的AI戰略和全棧全場景AI解決方案的雛形已初見端倪。
此外,阿里整合中天微與達摩院芯片團隊的“平頭哥半導體有限公司”,也
正在研發神經網絡芯片Ali-NPU,同時其也將推出自研IoT物聯網芯片,從云端向邊緣拓展。
在科技巨頭們紛紛涉足AI芯片的同時,一些初出茅廬的初創AI企業也想在這一領域分一杯羹。寒武紀、地平線、云之聲、依圖、思必馳、出門問問、Rokid、深鑒科技等等國內初創企業搶先推出自研AI芯片,從應用場景從面向上游的芯片設計邁出了重要的一步。
寒武紀成立與2015年,在國內并不被終端消費者所熟知,但提到華為全球首款移動端AI芯片——Kirin 970移動處理器,就不得不提寒武紀Cambricon-1A 神經網絡處理器。Cambricon-1A也由此成為了全球首個成功商用的深度學習處理器IP產品。此外,寒武紀分別在2018年5月和2019年5月推出云端芯片MLU100和思元270(MLU270),完善自身產品線和布局。去年6月,寒武紀完成數億美元B輪融資,投后整體估值為25億美元(約合167億人民幣),成為全球AI芯片創業公司的“領頭羊”。
地平線作為一家2015年成立的初創自動駕駛企業,2017年就推出了基于FPGA的自研BPU(Brain Processing Unit,腦處理單元)架構和“征程”和“旭日”兩款嵌入式AI視覺芯片,在業界先拔頭籌!今年2月27日,地平線獲得6億美元(約合40億人民幣)左右的B輪融資,估值達30億美元(約合200億人民幣),成為AI芯片領域“最值錢”的獨角獸。
5月9日,依圖推出自研云端AI芯Questcore以及基于該芯片構建的軟硬件一體化系列產品和行業解決方案。宣稱,該芯片在視覺推理上超越英偉達GPU,算法執行力可見一斑。
此外,云之聲面向物聯網以及思必馳、Rokid和出門問問都專注于AI語音芯片,是圍繞應用場景做文章的鮮明例子。
從目前兩大AI芯片新勢力陣營來看,明顯的特征就是結合自身應用場景的特點,通過自研AI芯片,以擺脫英偉達等老牌廠商的束縛,并實現掌控產業鏈上游,進一步提升行業話語權。事實上,這正是傳統硬件廠商的老套路,如今也在AI領域被活學活用。
合縱連橫
盡管各大科技、互聯網巨頭及初創企業“造芯”勢頭正如火如荼,但從目前的市場格局來看,英偉達GPU的地位仍然無人能夠撼動,尤其在需求量較大的云端推理層面,可謂一家獨大。正因此,英偉達也幾乎成為所有廠商對標的對象,一旦超越,其意義非比尋常。
為了突破大企業的壟斷,小企業采用合縱連橫的商業策略已成為一種潮流。雖然在AI芯片行業并沒有明顯的“拉幫結派”,但各廠商之間的強強聯手、深度合作,甚至抱團取暖的趨勢已日益顯著。
據Compass Intelligence的研究結果顯示,從2018年開始的過去三年中,各大公司藉由收購AI及AI新創企業,已經總共在研發、投資AI領域超過600億美元。AI新創公司就有約1700家,業界對于AI芯片組需求正逐漸擴大。
最典型的例子就是谷歌,近年來其收購的企業數量已近20家。蘋果公司在該AI領域也是動作頻頻,先后收購了Tuplejump等3家AI公司。
英特爾通過“買買買“,接連收購Mobileye、Nervana、Movidus,實現向自動輔助駕駛、神經網絡、機器視覺三大AI芯片應用場景的拓展,大大補充了自身實力。
同時,賽靈思收購國內的AI芯片新秀深鑒科技,從合作方到強強聯手,就是為了掌控FPGA構架及相關核心技術,以求與英偉達一爭高下。此外,依圖推出自研芯Questcore的背后,也離不開其投資的AI芯片初創團隊熠知電子(ThinkForce)的功勞。
鹿死誰手
無論是自研,還是收購、合作,廠商的目的都是快速推動AI芯片落地,與特定應用場景相結合,從而擴大市場或向新興領域拓展。然而,值得注意的是,目前ASIC構架由于可定制,易于為特定應用場景量身打造,獲得了大量廠商的認可,上文提到的谷歌、蘋果、華為等均采用了ASIC構架。同時,業內也有一種觀點,即ASIC的開發難度要低于處理復雜指令的通用芯片和FPGA構架芯片,所以ASIC被認為是如今實現快速“造芯”的殺手锏。
但事實并非如此。
盡管ASIC構架門檻有所降低,但目前仍然缺乏統一的標準,而且算法、軟件迭代速度又快,再加上芯片行業慣有的高投入、高風險、慢回報等特點,仍然危機重重。
由于其周期長,且試錯成本極高,風險也大,讓企業難以承受。目前,即便以谷歌為首的科技巨頭全面深入AI芯片領域,所以依靠的就是自身的財力支撐,但仍然面臨不小的風險。另一方面,初出茅廬的初創企業的加入戰局,與其先期巨額的投資不無關系,同時依托多方面的聯手,以減低風險,但相比科技巨頭來說,仍然將面臨不可預知的困難。
不過,無論各方面如何競爭,最后芯片制造的重擔仍然要落到臺積電等代工大廠身上,其實際產量和排期所決定了芯片何時問世。但不可忽略的是,在如今這個快速發展的大背景下,一旦產品延遲上市,很可能就是滅頂之災,性命攸關。
從這個層面來看,在AI芯片的“戰國時代”,扎堆“造芯”背后的最大的贏家說不定就成了芯片代工廠。
然而,無論是獨霸PC時代的英特爾,還是把持移動端的ARM、高通,對于布局AI芯片這一新興領域,都顯得有些吃力。同樣,即便是憑借GPU牢牢占據云端AI芯片頭把交椅的英偉達,在科技巨頭和新秀們的“圍剿”面前,仍然有翻車的危險。
歸根到底,AI芯片這一全新的領域,根本不存在無法逾越的“護城河”。
如今,谷歌、蘋果、亞馬遜、Facebook以及華為、阿里、百度等國內外巨頭紛紛涉足其中,群雄逐鹿,究竟誰能染指這個“香餑餑”?
帝國重器
眾所周知,AI的發展離不開三大元素:算法、算力和數據。其中算法、算力都與芯片密不可分,其重要性自然不言而喻。因此,AI芯片就猶如“帝國重器”一般,成為各大廠商爭奪的目標。
那何為AI芯片呢?它與傳統PC和移動芯片的區別何處?
從廣義上來說,AI芯片就是能執行AI算法的芯片。理論上,目前CPU、GPU等通用芯片都可以執行AI算法,只是效率、功耗上存在差異。從狹義上來說,AI芯片被定義為針對AI算法進行加速的專用芯片,也就是AI加速芯片或AI加速器。
顯然,由于通用型的芯片需要適應各種應用程序的需要,在執行AI算法時,效率自然不及專用的AI芯片,同時也難以控制功耗,性價比不高。而且,由于面向專用算法,AI芯片一般都側重于特定領域,例如語音識別、自然語言處理、圖像處理、自動駕駛等等,針對性較強。所以,傳統PC和移動芯片的區別,就在于是否能為AI算法加速。
關于AI芯片的類別,需要從構架、功能和場景三個維度來看。
首先,從構架來說,第一類是通用芯片,即GPU(Graphics Processing Unit,圖像處理單元),代表廠商就是英偉達、英特爾和AMD,其中英特爾在GPU集群上優勢明顯;第二類是FPGA(Field-Programmable Gate Array),即現場可編程門陣列,就是一種半定制的芯片,特點是可編程,目前賽靈思(XILINX)、Altera兩家占據了近90%的市場份額;第三類則是ASIC(Application Specific Integrated Circuit),即專用集成電路,是一種全定制化芯片,例如谷歌TPU、華為kirin系列等;第四類是類腦芯片,IBM的TrueNorth最具代表性,但離商業化落地還很遙遠,就不過多提及了。
值得注意的是,ASIC還衍生出NPU(神經網絡處理器),其專為深度學習設計,英特爾NNP、寒武紀NPU及華為麒麟系列等都是典型的代表。此外,在ASIC的基礎上,一些廠商還通過SoC+IP 模式,在一塊芯片上整合不同功能或者IP(半導體知識產權),也可以稱之為系統級芯片。其目的就是在有限的體積內實現密度的最大化,以提升芯片的性價比和移動性。
其次,從功能上來說,由于AI的機器學習和深度學習都離不開Training(訓練)和Inference(推理)兩大環節。所謂訓練,就是憑借大數據讓機器形成一個復雜的神經網絡算法模型。而推理則是通過該算法模型,讓機器模仿人做出推理或決策。在訓練方面,英偉達的GPU領先優勢相當明顯,幾乎成為標配。此外,英特爾、AMD 、賽靈思、谷歌等都有相應的解決方案。
推理方面,英偉達優勢不在,除了英特爾、谷歌、賽靈思等芯片大廠之外,科技巨頭亞馬遜、微軟、百度、阿里、騰訊、新興的寒武紀、地平線,以及移動端的高通、華為海思、ARM等也涉足其中,競爭之激烈可見一斑。
然后,從場景來看,AI芯片又分為云端和終端兩類。由于訓練需要龐大的數據量和高強度的運算量,單一處理器根本無法獨立完成,必須通過云端借助龐大的云端神經網絡才行。而在終端方面,各種智能終端可謂天差地別,尤其是移動端,為了滿足用戶越來越苛刻的要求以及增強體驗,就必須配備執行效率高的推理芯片,同時要兼具體積小巧及低功耗,要求也提升不少。
另外,業內還有許多不同的芯片構架和概念,這里就不一一列舉,但無論是GPU、FPGA、ASIC,還是NPU、TPU之類,歸根到底,就是為了實現AI算法效率的最大化,加強競爭力。
目前,全球AI芯片行業中,GPU可謂一枝獨秀,FPGA和ASIC則奮力追趕,盡管各有優缺點,但各自陣營都有鮮明的特點,例如GPU的性能強大、通用性強,功耗也巨大;FPGA可編程,靈活性和性能不錯,但價格過高;ASIC可定制,性能穩定,功耗也可控,但研發周期長、風險高。
大國爭霸
傳統顯示設備巨頭英偉達在AI芯片領域的崛起,看似無心插柳柳成蔭,但從深層次來說,也是其始終專注GPU而結出的碩果。
GPU以往主要用于圖形和視頻處理領域,能夠處理復雜且多數據處理,而正因此,其在性能方面大大優于CPU,同時輔以CUDA(Compute Unified Device Architecture,即通用并行計算架構),使其在AI領域如虎添翼,尤其在云端訓練上得到應用廣泛,促使英偉達在該領域一枝獨秀。
目前,各大AI廠商和云計算數據中心基本都配備英偉達GPU集群,構建超算中心,用于大規模的訓練,以支撐AI業務和應用場景的運作。
除此之外,英偉達還為自動駕駛、機器人、醫療等行業提供相應的AI解決方案。典型的例子就是,特斯拉在推出自有芯片之前,采用的就是英偉達的解決方案。
與此同時,傳統PC芯片“大哥大”英特爾與其老對手AMD也在積極向AI芯片方向拓展,但無奈CPU在算法上執行效率不高,GPU性能又不及英偉達,所以只得尋求新的機會。其中英特爾借助收購FPGA生產商Altera和機器視覺廠商Movidus,以涉足FPGA、 ASIC構架新領域,在數據中心市場加大布局力度。同時,還有傳言英特爾也在積極研發新一代GPU產品。而AMD則仍然依托自有GPU的優勢,是GPU的第二大市場,其定位也是數據中心。
IBM在芯片領域始終比較超前,除了前沿的類腦芯片之外,IBM 旗下Research AI團隊還用大規模的模擬存儲器陣列訓練深度神經網絡(DNN),已達到了與GPU相當的精度。
FPGA構架的“締造者”賽靈思在AI芯片領域早已有了布局。2018年,賽靈思推出一款超越FPGA功能的新產品——ACAP(自適應計算加速平臺)和Versal芯片,樹起FPGA反擊的大旗。
作為移動芯片領域的霸主,高通也推出了云端AI芯片Cloud AI 100加速器,針對數據中心。據悉,預計將于2019年下半年開始向客戶出樣。
目前,雖然移動端并非AI芯片競爭的主戰場,但ARM、高通、三星仍然在AI芯片上做文章,通過SoC+IP 模式,形成CPU+AI芯片+5G基帶芯片一體化的全新芯片組,以降低體積和功耗,適應移動終端的需要。盡管,現在云端訓練芯片當道,但面向終端的推理芯片的需求也日益迫切,隨著智能手機新能的突飛猛進,移動AI芯片無疑將逐漸走向前臺。

據市場研究顧問公司Compass Intelligence在2018年5月發布的關于AI芯片調研報告顯示,英偉達當仁不讓成為領頭羊,英特爾和IBM緊隨其后。值得注意的是谷歌、蘋果排在第四、第五的位置,顯然已經開始挑戰傳統芯片廠商的地位。此外,AMD、ARM、高通、三星、恩智浦仍然占據位列前十。博通、新思(Synopsys)、Marvell、賽靈思等老牌芯片廠商也排在前25位之中。
而令國人鼓舞的是,國內有7家廠商上榜,其中華為海思排名第12位,聯發科為第14位;兩家初創企業寒武紀(Cambricon)和地平線(Horizon)排名第23位和24位。余下的Imagination(原英國芯片廠商,已被中資收購)、瑞芯微(Rockchip)、芯原(Verisilcon)三家的知名度并不高,可謂“隱形冠軍”。
但毋庸置疑的是,目前全球AI芯片領域仍然呈現于“大國爭霸”的局面,以英偉達、英特爾、IBM、ARM、高通、三星等為首的老牌芯片廠商依舊占據市場主動。同時,以谷歌、蘋果等為代表的新興勢力和初創企業崛起的勢頭也難以阻擋。
實際上,僅僅從芯片的構架就能發現端倪。老牌廠商在傳統優勢構架在基礎上向全新領域拓展,而新興廠商則直接轉向可定制的全新解決方案, 其中ASIC構架正是趁著這一勢頭迅速升溫。當然,其背后離不開大量新興芯片廠商的推波助瀾,AI芯片行業至此呈現出“百家爭鳴“的新態勢。
百家爭鳴
在老牌芯片廠商尋求新突破方向的時候,兩股“造芯新勢力”開始脫穎而出。首先是以谷歌、蘋果、華為、阿里等為首的科技和互聯網巨頭開始涉足AI芯片領域,甚至特斯拉也舍棄英偉達的芯片解決方案,推出了自研的FSB全自動駕駛芯片。其次,初創AI企業早已崛起,寒武紀、地平線、依圖等新勢力接著資本風潮,也試圖進入芯片領域,以爭奪這一新興市場。
2016年,谷歌推出TPU(Tensor Processing Unit),基于ASIC構架,專為機器學習設計,配合自家深度學習框架TensorFlow,以加強算法模型的執行效率,并且同時可運用在訓練和推理上,適應性更強。值得注意的是,2016年名聲大噪的AlphaGo成功的背后,就離不開TPU芯片的支持。
2018年谷歌在Google I/O大會推出了TPU3.0,性能大幅提升。隨后,谷歌又接連推出面向云端的Cloud TPU和針對終端的Edge TPU兩款芯片,其目的就是挑戰英偉達GPU的霸主地位。
目前,憑借自身云計算的優勢,谷歌在云端AI芯片上的努力,已經給英偉達帶來了不小的沖擊。然而,英偉達在芯片領域擁有豐富的經驗和資源,且GPU具有先入為主的巨大優勢,通用性強,且牢牢占據市場主動,近期撼動其霸主地位顯然并不現實。
作為智能手機時代的開創者,蘋果在移動領域始終呼風喚雨。但是,蘋果在芯片上一直受制于人,顯然與其強勢的個性不符。所以,從2008年開始,蘋果就通過一系列收購,開始了自己的“造芯”之路。2017年9月,蘋果推出了全新的A11芯片,其采用ASIC構架,整合了一個專用于機器學習的神經網絡引擎(Apple Neural Engine)硬件,性能強大。2018年9月,蘋果又推出A12仿生芯片,AI能力再度加強。
與谷歌一樣,微軟和亞馬遜也在云計算領域具雄厚的實力。微軟代號為Project Catapult的FPGA構架AI芯片、亞馬遜云端AI芯片Inferentia均通過自研,以擺脫芯片廠商的束縛,提升自身云計算和相關應用的競爭力。
在國內互聯網企業中,百度在AI領域的拓展由來已久,并喊出「All in AI」的戰略目標。在繼“百度大腦”、深度學習框架PaddlePaddle、智能語音操作系統DuerOS和自動駕駛平臺Apollo之后,百度也推出了自研AI芯片——“昆侖”。據悉,“昆侖”基于百度CPU、GPU和FPGA加速器長達8年的研發,通過20多次的迭代產生。
最近名聲大振的華為海思,成立于2004年10月,其前身是創建于1991年的華為集成電路設計中心,可見華為的遠見。而在AI芯片方面,華為在云端、邊緣和移動端都有相應的解決方案。在移動端,先后推出了麒麟系列的Kirin970和Kirin980兩款AI芯片,從借鑒寒武紀NPU到自研首次集成雙NPU單元,AI性能大幅提升。
2018年10月,華為推出自研的達芬奇架構的昇騰系列AI芯片——Ascend 910和Ascend 310,昇騰910面向云端訓練和推理,直至競爭對手英偉達和谷歌,被稱之為當時單芯片計算密度最大的AI芯片。而Ascend 310為低功耗設計,針對邊緣計算,擁有nano、tiny、mini、lite和max五個系列,能提供橫跨全場景支持。至此,在AI芯片的支持下,華為的AI戰略和全棧全場景AI解決方案的雛形已初見端倪。
此外,阿里整合中天微與達摩院芯片團隊的“平頭哥半導體有限公司”,也
正在研發神經網絡芯片Ali-NPU,同時其也將推出自研IoT物聯網芯片,從云端向邊緣拓展。
在科技巨頭們紛紛涉足AI芯片的同時,一些初出茅廬的初創AI企業也想在這一領域分一杯羹。寒武紀、地平線、云之聲、依圖、思必馳、出門問問、Rokid、深鑒科技等等國內初創企業搶先推出自研AI芯片,從應用場景從面向上游的芯片設計邁出了重要的一步。
寒武紀成立與2015年,在國內并不被終端消費者所熟知,但提到華為全球首款移動端AI芯片——Kirin 970移動處理器,就不得不提寒武紀Cambricon-1A 神經網絡處理器。Cambricon-1A也由此成為了全球首個成功商用的深度學習處理器IP產品。此外,寒武紀分別在2018年5月和2019年5月推出云端芯片MLU100和思元270(MLU270),完善自身產品線和布局。去年6月,寒武紀完成數億美元B輪融資,投后整體估值為25億美元(約合167億人民幣),成為全球AI芯片創業公司的“領頭羊”。
地平線作為一家2015年成立的初創自動駕駛企業,2017年就推出了基于FPGA的自研BPU(Brain Processing Unit,腦處理單元)架構和“征程”和“旭日”兩款嵌入式AI視覺芯片,在業界先拔頭籌!今年2月27日,地平線獲得6億美元(約合40億人民幣)左右的B輪融資,估值達30億美元(約合200億人民幣),成為AI芯片領域“最值錢”的獨角獸。
5月9日,依圖推出自研云端AI芯Questcore以及基于該芯片構建的軟硬件一體化系列產品和行業解決方案。宣稱,該芯片在視覺推理上超越英偉達GPU,算法執行力可見一斑。
此外,云之聲面向物聯網以及思必馳、Rokid和出門問問都專注于AI語音芯片,是圍繞應用場景做文章的鮮明例子。
從目前兩大AI芯片新勢力陣營來看,明顯的特征就是結合自身應用場景的特點,通過自研AI芯片,以擺脫英偉達等老牌廠商的束縛,并實現掌控產業鏈上游,進一步提升行業話語權。事實上,這正是傳統硬件廠商的老套路,如今也在AI領域被活學活用。
合縱連橫
盡管各大科技、互聯網巨頭及初創企業“造芯”勢頭正如火如荼,但從目前的市場格局來看,英偉達GPU的地位仍然無人能夠撼動,尤其在需求量較大的云端推理層面,可謂一家獨大。正因此,英偉達也幾乎成為所有廠商對標的對象,一旦超越,其意義非比尋常。
為了突破大企業的壟斷,小企業采用合縱連橫的商業策略已成為一種潮流。雖然在AI芯片行業并沒有明顯的“拉幫結派”,但各廠商之間的強強聯手、深度合作,甚至抱團取暖的趨勢已日益顯著。
據Compass Intelligence的研究結果顯示,從2018年開始的過去三年中,各大公司藉由收購AI及AI新創企業,已經總共在研發、投資AI領域超過600億美元。AI新創公司就有約1700家,業界對于AI芯片組需求正逐漸擴大。
最典型的例子就是谷歌,近年來其收購的企業數量已近20家。蘋果公司在該AI領域也是動作頻頻,先后收購了Tuplejump等3家AI公司。
英特爾通過“買買買“,接連收購Mobileye、Nervana、Movidus,實現向自動輔助駕駛、神經網絡、機器視覺三大AI芯片應用場景的拓展,大大補充了自身實力。
同時,賽靈思收購國內的AI芯片新秀深鑒科技,從合作方到強強聯手,就是為了掌控FPGA構架及相關核心技術,以求與英偉達一爭高下。此外,依圖推出自研芯Questcore的背后,也離不開其投資的AI芯片初創團隊熠知電子(ThinkForce)的功勞。
鹿死誰手
無論是自研,還是收購、合作,廠商的目的都是快速推動AI芯片落地,與特定應用場景相結合,從而擴大市場或向新興領域拓展。然而,值得注意的是,目前ASIC構架由于可定制,易于為特定應用場景量身打造,獲得了大量廠商的認可,上文提到的谷歌、蘋果、華為等均采用了ASIC構架。同時,業內也有一種觀點,即ASIC的開發難度要低于處理復雜指令的通用芯片和FPGA構架芯片,所以ASIC被認為是如今實現快速“造芯”的殺手锏。
但事實并非如此。
盡管ASIC構架門檻有所降低,但目前仍然缺乏統一的標準,而且算法、軟件迭代速度又快,再加上芯片行業慣有的高投入、高風險、慢回報等特點,仍然危機重重。
由于其周期長,且試錯成本極高,風險也大,讓企業難以承受。目前,即便以谷歌為首的科技巨頭全面深入AI芯片領域,所以依靠的就是自身的財力支撐,但仍然面臨不小的風險。另一方面,初出茅廬的初創企業的加入戰局,與其先期巨額的投資不無關系,同時依托多方面的聯手,以減低風險,但相比科技巨頭來說,仍然將面臨不可預知的困難。
不過,無論各方面如何競爭,最后芯片制造的重擔仍然要落到臺積電等代工大廠身上,其實際產量和排期所決定了芯片何時問世。但不可忽略的是,在如今這個快速發展的大背景下,一旦產品延遲上市,很可能就是滅頂之災,性命攸關。
從這個層面來看,在AI芯片的“戰國時代”,扎堆“造芯”背后的最大的贏家說不定就成了芯片代工廠。