經(jīng)過20多年的本土化發(fā)展,安防經(jīng)歷了模擬、數(shù)字、網(wǎng)絡、高清4個時代,目前已經(jīng)進入到“安防+AI”智能化階段。就在傳統(tǒng)安防企業(yè)砥礪前行之時,廣闊的AI安防藍海市場吸引了眾多AI公司紛紛參與圍獵,就連BAT、華為等巨頭也參與其中。
5月27日,智能交通知名集成商千方科技宣布獲得阿里巴巴近36億元參股,一時竟引得行業(yè)紛紛競猜阿里巴巴的安防布局意圖。其實在此之前,阿里巴巴就已經(jīng)推出了布局智慧城市頂層應用的“城市大腦”,這是一套基于大數(shù)據(jù)應用的城市級管理平臺,也是阿里布局安防的標志。
以阿里之能,仍需投資一家擁有安防生態(tài)的集成商,至少說明阿里此前的安防布局進展并不順利,需要擴充資源來協(xié)助其AI技術在安防領域縱橫捭闔。
那么,安防究竟一個什么樣的行業(yè)?其AI生態(tài)都存在哪些痛點,竟然在眾多知名AI企業(yè)圍剿下仍需合縱連橫?
四重生態(tài),AI各有布局
我們看安防+AI,通常為算法+芯片、設備制造+解決方案、行業(yè)應用三級生態(tài)。
最上層為基礎算法和芯片,以宇視科技為代表的安防企業(yè)都開發(fā)有各自的AI算法;商湯、曠視、依圖、云從4大AI獨角獸更是聞名全球,可以說在算法端,中國企業(yè)、中國的安防公司都走在了世界前列。而芯片端,主流產(chǎn)品有GPU、ASIC、FPGA三大類型產(chǎn)品,相較國際芯片巨頭,中國已能滿足自給自足需求。
中游則是各種軟硬件產(chǎn)品和解決方案。宇視科技高級人工智能專家黃攀告訴OFweek安防網(wǎng):這是安防生態(tài)中,宇視科技等一眾安防企業(yè)的強項,可以提供從端計算——邊緣計算——云計算的三個覆蓋大安防各細分行業(yè)的所有產(chǎn)品和解決方案,其中就包括了AI、存儲、大數(shù)據(jù)等基礎應用。
下游為政府、教育、醫(yī)療、零售等各個行業(yè)場景應用,涉及的產(chǎn)業(yè)鏈和企業(yè)類型較多,除了深耕安防的設備商外,還包括運營服務商、系統(tǒng)集成商、軟件定制服務商等安防生態(tài)企業(yè);宇視黃攀指出,安防+AI的產(chǎn)品落地中,最終面對用戶的部分恰是產(chǎn)品變現(xiàn)的“最后一公里”。
除了上面三部分生態(tài),安防+AI還需要最底層的核心架構,也是最易為大家所忽視的部分。目前主流的AI底層架構有Caffe(卷積神經(jīng)網(wǎng)絡框架)、TensorFlow(第二代人工智能學習系統(tǒng))等,且掌握在谷歌、Facebook等國際巨頭手里,本土企業(yè)中,僅有百度、阿里巴巴、商湯、曠視等少數(shù)AI玩家在構建自己的深度學習架構。
2大因素制約早期AI爆發(fā)
人工智能之于安防,一直存在;只是人臉識別技術起來后,才廣被大眾所熟知。其實,安防領域是人工智能技術應用最早、類型最全的一個行業(yè),涵蓋車輛、行人、人臉、行為、動作、步態(tài)、物品、事件等的識別與應用,不過早期安防智能較集中于智能交通領域,對車輛的車牌識別、車輛品牌、顏色等車輛屬性涉及較多,近幾年才慢慢擴展到人體、人臉、動作、事件等各種智能方案。宇視黃攀認為,這是歷史發(fā)展規(guī)律使然,主要有受兩方面因素制約。
先從算法維度分析,安防業(yè)經(jīng)歷了從模擬——數(shù)字——高清——智能的轉(zhuǎn)變。早期安防首先需要解決的是圖像清晰化的命題,編解碼算法和圖像處理算法是業(yè)內(nèi)廠商最優(yōu)先發(fā)展的算法;隨著智能交通的興起,對車輛屬性的識別成為主流應用,傳統(tǒng)模式識別+淺層機器學習逐步在安防領域成為主流。隨著2012年AlexNet的驚艷表現(xiàn),深度學習算法得到爆發(fā)性發(fā)展,安防智能真正進入到“深度”智能階段,并最先在人臉識別領域得到大規(guī)模應用。
再從硬件維度分析,早期沒有專門針對人工智能的算法芯片——算力,當行業(yè)進入到深度學習算法階段后,專注于游戲業(yè)務的英偉達發(fā)現(xiàn)GPU在分布式計算、大規(guī)模集群運算中有著非常大的優(yōu)勢,由此找到了新的業(yè)務落腳點,并發(fā)力推出針對人工智能深度學習的多個產(chǎn)品線專用處理芯片,如工業(yè)級的Tesla系列、消費級的GTX系列等。
隨著算力的大幅提升,原先需要幾個月才能完成的深度訓練迭代,在分布式GPU集群的加持下,只需要幾個小時便可完成。
固定場景讓車輛識別脫穎而出
經(jīng)如上介紹,大家會產(chǎn)生新的疑惑:在深度學習算法興起之前,為什么車牌識別技術能在眾多的AI應用中脫穎而出?
對此,宇視黃攀給出了兩個字的答案——場景,他進一步分析道:“早期的智能交通雖然采用的是普通圖像處理和淺層機器學習技術,但它們與其他AI應用最大的區(qū)別在于有標準化場景,如卡口、電警中的六米安裝高度、夜間提供爆閃補光、專業(yè)的圖像調(diào)教、45度朝下抓拍角度等,加上車輛的可變動幅度不大,使得抓拍的圖像非常清晰,因此在傳統(tǒng)算法下也有非常高的識別率,可做到95%~99%的精準識別效果。”
需要說明的是,在2010-2012年,小編曾做過多次車輛抓拍識別測試,即便是采用200萬像素智能交通攝像機,只要場景設置得當,識別率可輕松做到99%,很好佐證了宇視黃攀的觀點。
但傳統(tǒng)方案也有缺陷,一是算法對多種場景的適應性難以進一步提升,如識別率很難趨近于100%;二是傳統(tǒng)的淺層機器學習在特征提取、算法設計上對開發(fā)人員要求較高,不能很好滿足智能交通的復雜場景需求。
在進入到深度學習階段,大量的場景適應性問題通過豐富的訓練素材讓算法在訓練迭代中得到解決,大幅提升了算法魯棒性,大大簡化了對技術人員的要求。利用新的算法體系做視頻結構化,在標準場景下,車牌識別率無限趨近于100%;而在非標準場景下,車牌識別率也能達到98%以上,如輔助卡口的車牌抓拍識別應用。
不過早期與車牌識別應用幾乎同時發(fā)展的人臉識別需求卻始終無法滿足,主要受兩大因素制約,一是因為人臉并不像車牌那樣是一種相對固定的模型,人臉在檢測過程中受到姿態(tài)、表情、穿戴物、朝向、年齡等各種因素的影響;二是攝像機的安裝場景無法達到交通卡口般的標準化水平,受環(huán)境影響較大。
通過淺層機器學習算法在這樣的條件下完成人臉識別會遇到非常大的挑戰(zhàn),特征提取方式嚴重依賴工程師的豐富經(jīng)驗:不同場景下,邊緣特征、顏色特征等的提取需要工程師具備非常好的數(shù)學能力和經(jīng)驗,如此才能設計出最佳特征提取方式;即便如此,人臉識別還要面臨人員移動隨意性、臉部裝飾、環(huán)境光照等的制約,識別率難以有保障。這些問題的存在,一度讓人臉識別難以在實際場景中得到落地。
利用深度學習算法后,機器可自學習最適合的特征提取方式,對工程師的依賴大大降低。設備通過大數(shù)據(jù)學習獲取人臉特征經(jīng)驗,以此來自動識別人臉,由原來的經(jīng)驗為王轉(zhuǎn)變?yōu)橐詳?shù)據(jù)為王,更是突破了逆光人臉、陰陽臉、戴墨鏡、戴帽子等極端場景人臉的識別障礙。
自此,深度學習讓人臉識別得到了爆發(fā)式發(fā)展,這也使得人臉識別成為安防第一個變現(xiàn)的深度人工智能技術。顯而易見,深度學習給人臉識別帶來了巨大改變——讓理想照進現(xiàn)實,并得到了眾安防企業(yè)的高度重視,開始將該技術逐步移植到車牌識別、行為分析、事件分析,甚至是大數(shù)據(jù)等其他AI應用中來。
“AI+安防”和“安防+AI”的界限仍很明顯
目前圍獵安防AI應用的企業(yè)很多,主要有兩大類,一是以4大算法公司(商湯、曠視、依圖、云從)為代表的AI獨角獸,他們主推“AI+安防”模式;二是以宇視科技等公司為代表的安防陣營,主導“安防+AI”之路。
宇視黃攀認為,截至目前,“AI+安防”和“安防+AI”的界限仍很明顯。
以4大算法公司提出的“AI+安防”為例,他們的定位是“1+1+X”,即“算法+產(chǎn)品+行業(yè)解決方案”,“X”代表各行各業(yè)的行業(yè)解決方案,安防只是其中之一。AI公司的行業(yè)賦能模式屬于扁平化架構,主要是解決算法問題,這使得他們在安防領域的耕耘沒有傳統(tǒng)安防企業(yè)透徹。
又因為安防是AI落地最深、最廣的一個行業(yè),為了實現(xiàn)營收,AI公司選擇安防行業(yè)來進行算法驗證和變現(xiàn),因此我們看到,現(xiàn)在AI公司越來越重視安防行業(yè)。
而以宇視為代表的安防企業(yè)提出的“安防+AI”,基于大安防的整體生態(tài)鏈比較完備,從上游的人工智能算法、中游軟硬件/解決方案,到下游行業(yè)定制軟件等都一應俱全,尤其在前端智能IPC、智能NVR、智能存儲上有突出的優(yōu)勢,加上早已在多年積累中建立了完善的營銷渠道。安防企業(yè)可以輕松地讓AI產(chǎn)品在安防垂直細分領域得到快速變現(xiàn),這是安防陣營跟AI陣營耕耘“安防+AI”的最大區(qū)別。
當然,我們也看到,目前安防公司跟AI公司的相互滲透越來越多,在AI公司進入安防領域的同時,安防公司也在不斷向教育、醫(yī)療、金融等垂直領域延伸,將AI的適用范圍不再局限于安全防護。
賦能安防,AI面臨哪些困境
宇視黃攀告訴OFweek安防網(wǎng),目前AI賦能安防主要面臨兩大難題,即大規(guī)模應用能力和產(chǎn)品變現(xiàn)能力。
首先,黃攀認為安防的AI產(chǎn)品面臨的最大困難不再是算法、算力、大數(shù)據(jù)等技術問題,而是轉(zhuǎn)移到AI六要素中的工程、場景、方案等實際落地應用問題。
目前很多公司對外宣稱自己支持AI深度學習,并獲得了從央視到行業(yè)垂直媒體的大力度推廣,讓用戶產(chǎn)生錯覺,并對AI抱以很高期待,忽略了算法與場景,算法與產(chǎn)品工程化的匹配問題,甚至超出了目前AI的能力范圍,導致項目落地后的應用效果與用戶預期效果形成落差。
其次是AI的產(chǎn)品變現(xiàn)能力還在探索中。現(xiàn)在所有的行業(yè)都歡迎AI產(chǎn)品,但大量的細分市場的定制化需求、定制化解決方案未能同步跟上,若采用通用方案,則效果大打折扣,需要各行各業(yè)的AI玩家持之以恒地開發(fā)與完善。
在安防領域,宇視等傳統(tǒng)安防企業(yè)對各類場景都有很深滲透與理解,細化解決方案定制能力強,因此變現(xiàn)能力相對強很多。即便如此,安防企業(yè)還是會遇到很多問題,如各種定制化需求、各類型場景方案開發(fā)等,給經(jīng)驗豐富的安防企業(yè)提出了很大挑戰(zhàn)。
其中細分市場的定制化算法難度最大,黃攀以監(jiān)獄的“打架檢測”為例介紹。“打架”是一種人類的常識性的事件描述,背后是大量人類認知的體現(xiàn),跟通常的車輛、人臉這種相對有固定邊界的模型不同,是一種寬泛的、形容性的概念。人類需要訓練AI算法,什么才是“打架”,但是打架并非固定模式,有可能是群體的劇烈沖突,也可能是一方對另一方的霸凌,動作不劇烈,更有可能是被多人環(huán)繞的隱蔽式?jīng)_突,形式非常寬泛;這就需要突破傳統(tǒng)深度學習對固定模型的檢測能力,升華到對人體動作的理解能力。
邊緣云計算是AI賦能探索的結果
原來的中心云方案是將資源集中在云端處理,這會帶來很大的帶寬傳輸壓力,導致數(shù)據(jù)丟失、高延時等情況變得頻繁。同時對定制化需求無能為力。
實際上,前端算力資源非常龐大,哪怕是單價幾百元的前端攝像機,其算力、算法也已經(jīng)能很好地實現(xiàn)人臉識別等功能,不需要額外投入云處理系統(tǒng)。
因此,邊緣云計算是安防公司在多年探索中形成的共識,不僅充分利用了各類型算力資源,還很好地降低了投入成本。
目前國內(nèi)芯片性能提升明顯,以海思、寒武紀為代表的ASIC芯片方案,與英偉達等企業(yè)的產(chǎn)品相比已不落下風,尤其是單路視頻識別的性價比更高,現(xiàn)已成為安防行業(yè)前端AI芯片首選。
在服務器端,安防公司并不局限于英偉達的通用GPU方案,基于ASIC的專用AI板卡方案也被廣泛接受。以宇視“昆侖”系列智能分析服務器為例,集成了數(shù)十顆專用AI加速芯片,在三層分布式計算架構的加持下,并發(fā)計算能力達到業(yè)內(nèi)領先水平。
賦能“意識”、降低成本是AI未來發(fā)展走勢
不可否認,目前AI還存在很多痛點,黃攀認為其中賦予機器 更多的“聯(lián)想能力”是提升AI應用能力的重要部分,如以圖搜圖檢索人的應用中,用于檢索的算法可能難以檢索出更換衣服、更換交通工具、僅局部特征、時間跨度長、晝夜相反、圖像模糊等數(shù)據(jù)庫中的同一個“人”的圖片/視頻;這時候就需要現(xiàn)有的人臉人體半結構化特征與動作識別、步態(tài)識別等新的AI技術關聯(lián)起來,這是接下來AI在安防應用中的重點發(fā)展領域。
另外,無論云計算還是邊緣計算,共同目標都是為了降低單路AI商用成本。宇視“昆侖”的推出,正是為了解決這一痛點,它提出了多模型、多智能、ALL in One的設計理念,可將人臉識別服務器、行為分析服務器、視頻結構化服務器、大數(shù)據(jù)服務器、平臺服務器等功能以板卡形式集成于一臺服務器中,大大節(jié)約了硬件投入和空間占用,而且維護更為簡便;其同時集成了3重分布式集群調(diào)度系統(tǒng)(芯片間集群調(diào)度、板卡間集群調(diào)度、服務器間集群調(diào)度),可將AI處理需求精確地分配到每一顆芯片中的某一部分資源,大大降低了單路視頻的應用成本。
最后,算力也是未來要提升的部分。目前國內(nèi)芯片廠家的發(fā)展速度很快,尤其是在AI端側(cè)應用芯片領域,國內(nèi)芯片的發(fā)展已經(jīng)出現(xiàn)多強爭霸的局面,正在快速沖擊著目前的格局。在通用芯片領域,雖然我們沒有先發(fā)優(yōu)勢,但在近年國家政策的扶持和行業(yè)需求的多重驅(qū)動下,各大芯片廠商正在奮起直追,預計很快就會迎來產(chǎn)業(yè)變局。
5月27日,智能交通知名集成商千方科技宣布獲得阿里巴巴近36億元參股,一時竟引得行業(yè)紛紛競猜阿里巴巴的安防布局意圖。其實在此之前,阿里巴巴就已經(jīng)推出了布局智慧城市頂層應用的“城市大腦”,這是一套基于大數(shù)據(jù)應用的城市級管理平臺,也是阿里布局安防的標志。
以阿里之能,仍需投資一家擁有安防生態(tài)的集成商,至少說明阿里此前的安防布局進展并不順利,需要擴充資源來協(xié)助其AI技術在安防領域縱橫捭闔。
那么,安防究竟一個什么樣的行業(yè)?其AI生態(tài)都存在哪些痛點,竟然在眾多知名AI企業(yè)圍剿下仍需合縱連橫?
四重生態(tài),AI各有布局
我們看安防+AI,通常為算法+芯片、設備制造+解決方案、行業(yè)應用三級生態(tài)。
最上層為基礎算法和芯片,以宇視科技為代表的安防企業(yè)都開發(fā)有各自的AI算法;商湯、曠視、依圖、云從4大AI獨角獸更是聞名全球,可以說在算法端,中國企業(yè)、中國的安防公司都走在了世界前列。而芯片端,主流產(chǎn)品有GPU、ASIC、FPGA三大類型產(chǎn)品,相較國際芯片巨頭,中國已能滿足自給自足需求。
中游則是各種軟硬件產(chǎn)品和解決方案。宇視科技高級人工智能專家黃攀告訴OFweek安防網(wǎng):這是安防生態(tài)中,宇視科技等一眾安防企業(yè)的強項,可以提供從端計算——邊緣計算——云計算的三個覆蓋大安防各細分行業(yè)的所有產(chǎn)品和解決方案,其中就包括了AI、存儲、大數(shù)據(jù)等基礎應用。
下游為政府、教育、醫(yī)療、零售等各個行業(yè)場景應用,涉及的產(chǎn)業(yè)鏈和企業(yè)類型較多,除了深耕安防的設備商外,還包括運營服務商、系統(tǒng)集成商、軟件定制服務商等安防生態(tài)企業(yè);宇視黃攀指出,安防+AI的產(chǎn)品落地中,最終面對用戶的部分恰是產(chǎn)品變現(xiàn)的“最后一公里”。
除了上面三部分生態(tài),安防+AI還需要最底層的核心架構,也是最易為大家所忽視的部分。目前主流的AI底層架構有Caffe(卷積神經(jīng)網(wǎng)絡框架)、TensorFlow(第二代人工智能學習系統(tǒng))等,且掌握在谷歌、Facebook等國際巨頭手里,本土企業(yè)中,僅有百度、阿里巴巴、商湯、曠視等少數(shù)AI玩家在構建自己的深度學習架構。
2大因素制約早期AI爆發(fā)
人工智能之于安防,一直存在;只是人臉識別技術起來后,才廣被大眾所熟知。其實,安防領域是人工智能技術應用最早、類型最全的一個行業(yè),涵蓋車輛、行人、人臉、行為、動作、步態(tài)、物品、事件等的識別與應用,不過早期安防智能較集中于智能交通領域,對車輛的車牌識別、車輛品牌、顏色等車輛屬性涉及較多,近幾年才慢慢擴展到人體、人臉、動作、事件等各種智能方案。宇視黃攀認為,這是歷史發(fā)展規(guī)律使然,主要有受兩方面因素制約。
先從算法維度分析,安防業(yè)經(jīng)歷了從模擬——數(shù)字——高清——智能的轉(zhuǎn)變。早期安防首先需要解決的是圖像清晰化的命題,編解碼算法和圖像處理算法是業(yè)內(nèi)廠商最優(yōu)先發(fā)展的算法;隨著智能交通的興起,對車輛屬性的識別成為主流應用,傳統(tǒng)模式識別+淺層機器學習逐步在安防領域成為主流。隨著2012年AlexNet的驚艷表現(xiàn),深度學習算法得到爆發(fā)性發(fā)展,安防智能真正進入到“深度”智能階段,并最先在人臉識別領域得到大規(guī)模應用。
再從硬件維度分析,早期沒有專門針對人工智能的算法芯片——算力,當行業(yè)進入到深度學習算法階段后,專注于游戲業(yè)務的英偉達發(fā)現(xiàn)GPU在分布式計算、大規(guī)模集群運算中有著非常大的優(yōu)勢,由此找到了新的業(yè)務落腳點,并發(fā)力推出針對人工智能深度學習的多個產(chǎn)品線專用處理芯片,如工業(yè)級的Tesla系列、消費級的GTX系列等。
隨著算力的大幅提升,原先需要幾個月才能完成的深度訓練迭代,在分布式GPU集群的加持下,只需要幾個小時便可完成。
固定場景讓車輛識別脫穎而出
經(jīng)如上介紹,大家會產(chǎn)生新的疑惑:在深度學習算法興起之前,為什么車牌識別技術能在眾多的AI應用中脫穎而出?
對此,宇視黃攀給出了兩個字的答案——場景,他進一步分析道:“早期的智能交通雖然采用的是普通圖像處理和淺層機器學習技術,但它們與其他AI應用最大的區(qū)別在于有標準化場景,如卡口、電警中的六米安裝高度、夜間提供爆閃補光、專業(yè)的圖像調(diào)教、45度朝下抓拍角度等,加上車輛的可變動幅度不大,使得抓拍的圖像非常清晰,因此在傳統(tǒng)算法下也有非常高的識別率,可做到95%~99%的精準識別效果。”
需要說明的是,在2010-2012年,小編曾做過多次車輛抓拍識別測試,即便是采用200萬像素智能交通攝像機,只要場景設置得當,識別率可輕松做到99%,很好佐證了宇視黃攀的觀點。
但傳統(tǒng)方案也有缺陷,一是算法對多種場景的適應性難以進一步提升,如識別率很難趨近于100%;二是傳統(tǒng)的淺層機器學習在特征提取、算法設計上對開發(fā)人員要求較高,不能很好滿足智能交通的復雜場景需求。
在進入到深度學習階段,大量的場景適應性問題通過豐富的訓練素材讓算法在訓練迭代中得到解決,大幅提升了算法魯棒性,大大簡化了對技術人員的要求。利用新的算法體系做視頻結構化,在標準場景下,車牌識別率無限趨近于100%;而在非標準場景下,車牌識別率也能達到98%以上,如輔助卡口的車牌抓拍識別應用。
不過早期與車牌識別應用幾乎同時發(fā)展的人臉識別需求卻始終無法滿足,主要受兩大因素制約,一是因為人臉并不像車牌那樣是一種相對固定的模型,人臉在檢測過程中受到姿態(tài)、表情、穿戴物、朝向、年齡等各種因素的影響;二是攝像機的安裝場景無法達到交通卡口般的標準化水平,受環(huán)境影響較大。
通過淺層機器學習算法在這樣的條件下完成人臉識別會遇到非常大的挑戰(zhàn),特征提取方式嚴重依賴工程師的豐富經(jīng)驗:不同場景下,邊緣特征、顏色特征等的提取需要工程師具備非常好的數(shù)學能力和經(jīng)驗,如此才能設計出最佳特征提取方式;即便如此,人臉識別還要面臨人員移動隨意性、臉部裝飾、環(huán)境光照等的制約,識別率難以有保障。這些問題的存在,一度讓人臉識別難以在實際場景中得到落地。
利用深度學習算法后,機器可自學習最適合的特征提取方式,對工程師的依賴大大降低。設備通過大數(shù)據(jù)學習獲取人臉特征經(jīng)驗,以此來自動識別人臉,由原來的經(jīng)驗為王轉(zhuǎn)變?yōu)橐詳?shù)據(jù)為王,更是突破了逆光人臉、陰陽臉、戴墨鏡、戴帽子等極端場景人臉的識別障礙。
自此,深度學習讓人臉識別得到了爆發(fā)式發(fā)展,這也使得人臉識別成為安防第一個變現(xiàn)的深度人工智能技術。顯而易見,深度學習給人臉識別帶來了巨大改變——讓理想照進現(xiàn)實,并得到了眾安防企業(yè)的高度重視,開始將該技術逐步移植到車牌識別、行為分析、事件分析,甚至是大數(shù)據(jù)等其他AI應用中來。
“AI+安防”和“安防+AI”的界限仍很明顯
目前圍獵安防AI應用的企業(yè)很多,主要有兩大類,一是以4大算法公司(商湯、曠視、依圖、云從)為代表的AI獨角獸,他們主推“AI+安防”模式;二是以宇視科技等公司為代表的安防陣營,主導“安防+AI”之路。
宇視黃攀認為,截至目前,“AI+安防”和“安防+AI”的界限仍很明顯。
以4大算法公司提出的“AI+安防”為例,他們的定位是“1+1+X”,即“算法+產(chǎn)品+行業(yè)解決方案”,“X”代表各行各業(yè)的行業(yè)解決方案,安防只是其中之一。AI公司的行業(yè)賦能模式屬于扁平化架構,主要是解決算法問題,這使得他們在安防領域的耕耘沒有傳統(tǒng)安防企業(yè)透徹。
又因為安防是AI落地最深、最廣的一個行業(yè),為了實現(xiàn)營收,AI公司選擇安防行業(yè)來進行算法驗證和變現(xiàn),因此我們看到,現(xiàn)在AI公司越來越重視安防行業(yè)。
而以宇視為代表的安防企業(yè)提出的“安防+AI”,基于大安防的整體生態(tài)鏈比較完備,從上游的人工智能算法、中游軟硬件/解決方案,到下游行業(yè)定制軟件等都一應俱全,尤其在前端智能IPC、智能NVR、智能存儲上有突出的優(yōu)勢,加上早已在多年積累中建立了完善的營銷渠道。安防企業(yè)可以輕松地讓AI產(chǎn)品在安防垂直細分領域得到快速變現(xiàn),這是安防陣營跟AI陣營耕耘“安防+AI”的最大區(qū)別。
當然,我們也看到,目前安防公司跟AI公司的相互滲透越來越多,在AI公司進入安防領域的同時,安防公司也在不斷向教育、醫(yī)療、金融等垂直領域延伸,將AI的適用范圍不再局限于安全防護。
賦能安防,AI面臨哪些困境
宇視黃攀告訴OFweek安防網(wǎng),目前AI賦能安防主要面臨兩大難題,即大規(guī)模應用能力和產(chǎn)品變現(xiàn)能力。
首先,黃攀認為安防的AI產(chǎn)品面臨的最大困難不再是算法、算力、大數(shù)據(jù)等技術問題,而是轉(zhuǎn)移到AI六要素中的工程、場景、方案等實際落地應用問題。
目前很多公司對外宣稱自己支持AI深度學習,并獲得了從央視到行業(yè)垂直媒體的大力度推廣,讓用戶產(chǎn)生錯覺,并對AI抱以很高期待,忽略了算法與場景,算法與產(chǎn)品工程化的匹配問題,甚至超出了目前AI的能力范圍,導致項目落地后的應用效果與用戶預期效果形成落差。
其次是AI的產(chǎn)品變現(xiàn)能力還在探索中。現(xiàn)在所有的行業(yè)都歡迎AI產(chǎn)品,但大量的細分市場的定制化需求、定制化解決方案未能同步跟上,若采用通用方案,則效果大打折扣,需要各行各業(yè)的AI玩家持之以恒地開發(fā)與完善。
在安防領域,宇視等傳統(tǒng)安防企業(yè)對各類場景都有很深滲透與理解,細化解決方案定制能力強,因此變現(xiàn)能力相對強很多。即便如此,安防企業(yè)還是會遇到很多問題,如各種定制化需求、各類型場景方案開發(fā)等,給經(jīng)驗豐富的安防企業(yè)提出了很大挑戰(zhàn)。
其中細分市場的定制化算法難度最大,黃攀以監(jiān)獄的“打架檢測”為例介紹。“打架”是一種人類的常識性的事件描述,背后是大量人類認知的體現(xiàn),跟通常的車輛、人臉這種相對有固定邊界的模型不同,是一種寬泛的、形容性的概念。人類需要訓練AI算法,什么才是“打架”,但是打架并非固定模式,有可能是群體的劇烈沖突,也可能是一方對另一方的霸凌,動作不劇烈,更有可能是被多人環(huán)繞的隱蔽式?jīng)_突,形式非常寬泛;這就需要突破傳統(tǒng)深度學習對固定模型的檢測能力,升華到對人體動作的理解能力。
邊緣云計算是AI賦能探索的結果
原來的中心云方案是將資源集中在云端處理,這會帶來很大的帶寬傳輸壓力,導致數(shù)據(jù)丟失、高延時等情況變得頻繁。同時對定制化需求無能為力。
實際上,前端算力資源非常龐大,哪怕是單價幾百元的前端攝像機,其算力、算法也已經(jīng)能很好地實現(xiàn)人臉識別等功能,不需要額外投入云處理系統(tǒng)。
因此,邊緣云計算是安防公司在多年探索中形成的共識,不僅充分利用了各類型算力資源,還很好地降低了投入成本。
目前國內(nèi)芯片性能提升明顯,以海思、寒武紀為代表的ASIC芯片方案,與英偉達等企業(yè)的產(chǎn)品相比已不落下風,尤其是單路視頻識別的性價比更高,現(xiàn)已成為安防行業(yè)前端AI芯片首選。
在服務器端,安防公司并不局限于英偉達的通用GPU方案,基于ASIC的專用AI板卡方案也被廣泛接受。以宇視“昆侖”系列智能分析服務器為例,集成了數(shù)十顆專用AI加速芯片,在三層分布式計算架構的加持下,并發(fā)計算能力達到業(yè)內(nèi)領先水平。
賦能“意識”、降低成本是AI未來發(fā)展走勢
不可否認,目前AI還存在很多痛點,黃攀認為其中賦予機器 更多的“聯(lián)想能力”是提升AI應用能力的重要部分,如以圖搜圖檢索人的應用中,用于檢索的算法可能難以檢索出更換衣服、更換交通工具、僅局部特征、時間跨度長、晝夜相反、圖像模糊等數(shù)據(jù)庫中的同一個“人”的圖片/視頻;這時候就需要現(xiàn)有的人臉人體半結構化特征與動作識別、步態(tài)識別等新的AI技術關聯(lián)起來,這是接下來AI在安防應用中的重點發(fā)展領域。
另外,無論云計算還是邊緣計算,共同目標都是為了降低單路AI商用成本。宇視“昆侖”的推出,正是為了解決這一痛點,它提出了多模型、多智能、ALL in One的設計理念,可將人臉識別服務器、行為分析服務器、視頻結構化服務器、大數(shù)據(jù)服務器、平臺服務器等功能以板卡形式集成于一臺服務器中,大大節(jié)約了硬件投入和空間占用,而且維護更為簡便;其同時集成了3重分布式集群調(diào)度系統(tǒng)(芯片間集群調(diào)度、板卡間集群調(diào)度、服務器間集群調(diào)度),可將AI處理需求精確地分配到每一顆芯片中的某一部分資源,大大降低了單路視頻的應用成本。
最后,算力也是未來要提升的部分。目前國內(nèi)芯片廠家的發(fā)展速度很快,尤其是在AI端側(cè)應用芯片領域,國內(nèi)芯片的發(fā)展已經(jīng)出現(xiàn)多強爭霸的局面,正在快速沖擊著目前的格局。在通用芯片領域,雖然我們沒有先發(fā)優(yōu)勢,但在近年國家政策的扶持和行業(yè)需求的多重驅(qū)動下,各大芯片廠商正在奮起直追,預計很快就會迎來產(chǎn)業(yè)變局。