安防行業(yè)作為應(yīng)用AI和多模態(tài)大模型的先鋒領(lǐng)域,展示出其在發(fā)展新質(zhì)生產(chǎn)力方面的強(qiáng)大產(chǎn)業(yè)基礎(chǔ)和能力:
從業(yè)人員眾多、生態(tài)完整:安防產(chǎn)業(yè)鏈條長(zhǎng),從硬件制造、軟件開(kāi)發(fā)到系統(tǒng)集成、服務(wù)運(yùn)營(yíng),形成了一個(gè)完整的產(chǎn)業(yè)生態(tài)。這種完整的生態(tài)系統(tǒng)促進(jìn)了技術(shù)知識(shí)和行業(yè)經(jīng)驗(yàn)的累積與傳承,加速了新技術(shù)的研發(fā)和推廣。
加速AI落地應(yīng)用,安防是核心應(yīng)用場(chǎng)景
安防行業(yè)是人工智能、物聯(lián)網(wǎng)、大數(shù)據(jù)等先進(jìn)技術(shù)最早得到應(yīng)用和驗(yàn)證的領(lǐng)域之一。這些技術(shù)的融合應(yīng)用不僅極大地提升了安防產(chǎn)品和服務(wù)的性能,也推動(dòng)了行業(yè)自身的升級(jí)和變革。
應(yīng)用場(chǎng)景眾多:眼見(jiàn)為實(shí),安防因?yàn)槠鋽?shù)據(jù)的豐富性,在計(jì)算機(jī)視覺(jué)(CV)技術(shù)的驅(qū)動(dòng)下,智能安防已經(jīng)跳出傳統(tǒng)技防的范疇,從安全防控走向安全生產(chǎn),走向基于數(shù)據(jù)和算力驅(qū)動(dòng)的智慧運(yùn)營(yíng),躍升至為城市管理、商業(yè)決策等提供智能數(shù)據(jù)服務(wù)的新階段。
聚焦“AI+安防”融合創(chuàng)新,依圖科技推出天問(wèn)大模型
而依圖科技多年來(lái)一直專(zhuān)注于人工智能技術(shù)在安防領(lǐng)域的實(shí)踐和應(yīng)用,早在2019年便開(kāi)始研究以Transformer為基礎(chǔ)的大模型發(fā)展和應(yīng)用,并將圖像感知、視頻感知與大模型結(jié)合,在2023年底發(fā)布了可對(duì)話(huà)、會(huì)思考、能進(jìn)化的“天問(wèn)”多模態(tài)大模型,在公共安全、智慧城市、智慧交通、內(nèi)容審核、智慧園區(qū)等多個(gè)領(lǐng)域?qū)嵺`,推動(dòng)關(guān)鍵技術(shù)轉(zhuǎn)化為真正的生產(chǎn)力。
由依圖科技創(chuàng)新打造的“天問(wèn)”多模態(tài)大模型,已在全國(guó)幾十個(gè)項(xiàng)目中實(shí)戰(zhàn)部署,在視頻語(yǔ)義搜索、萬(wàn)物識(shí)別、AI智能體編排以及算法零樣本冷啟動(dòng)等方面展現(xiàn)出巨大潛力。具體場(chǎng)景中,公共安全、智慧城市建設(shè)、智慧交通、內(nèi)容審核和智慧園區(qū)等方向的應(yīng)用進(jìn)展顯著,這些領(lǐng)域?qū)σ曨l分析、行為識(shí)別和實(shí)時(shí)反應(yīng)的需求不斷增長(zhǎng)。
天問(wèn)大模型3大特性,破解傳統(tǒng)安防技術(shù)應(yīng)用難題
安防從高清走向智能,這是AI安防1.0,人臉識(shí)別、人體ReID、視頻結(jié)構(gòu)化、車(chē)輛/非機(jī)動(dòng)車(chē)結(jié)構(gòu)化就是這個(gè)時(shí)期的作品。但是一旦安防的應(yīng)用進(jìn)入安全生產(chǎn)就會(huì)面臨長(zhǎng)尾算法的需求。而傳統(tǒng)深度學(xué)習(xí)模型基于是監(jiān)督學(xué)習(xí)方法訓(xùn)練出來(lái)的,在面臨到這個(gè)復(fù)雜場(chǎng)景的時(shí)候就會(huì)有很多約束和限制,這就導(dǎo)致過(guò)去這七八年AI安防雖然有些進(jìn)展、但是落地的并不好。大模型時(shí)代下進(jìn)入AI 2.0,基于Transformer架構(gòu),依圖天問(wèn)多模態(tài)大模型徹底顛覆了傳統(tǒng)安防行業(yè)的碎片化特點(diǎn),會(huì)呈現(xiàn)3個(gè)特性:
1、會(huì)思考
多模態(tài)大模型不再像過(guò)去一樣只是某種算法、某種工具,而是呈現(xiàn)出助手、智能體的特征,讓機(jī)器看一遍視頻,它能夠準(zhǔn)確識(shí)別視頻中的內(nèi)容,將機(jī)器看視頻的能力轉(zhuǎn)化為直觀的算法,為安防行業(yè)帶來(lái)了革命性的變革。
2、可對(duì)話(huà)
人使用多模態(tài)大模型的過(guò)程更像與另外一個(gè)人交流。用戶(hù)可以通過(guò)語(yǔ)義搜索和語(yǔ)音指令調(diào)取視頻,例如,僅需簡(jiǎn)單地說(shuō)出“請(qǐng)調(diào)取有積水的點(diǎn)位視頻”,系統(tǒng)便能迅速響應(yīng),展現(xiàn)所有相關(guān)的視頻片段。這一功能極大地提升了指揮調(diào)度的效率,節(jié)省了寶貴的決策和調(diào)度時(shí)間。
3、能進(jìn)化
能進(jìn)化是依圖天問(wèn)大模型的另一大亮點(diǎn)。不能根據(jù)用戶(hù)和環(huán)境而進(jìn)化的智能系統(tǒng)是工具,不是真智能。依圖天問(wèn)大模型支持現(xiàn)場(chǎng)算法訓(xùn)練,能夠根據(jù)實(shí)際應(yīng)用需求快速迭代和優(yōu)化。一個(gè)新的算法需求可以在1分鐘內(nèi)實(shí)現(xiàn)0樣本冷啟動(dòng),1小時(shí)內(nèi)完成在線標(biāo)注訓(xùn)練,并在1天內(nèi)快速上線,展現(xiàn)了前所未有的智能化和靈活性。
算法準(zhǔn)確率90%+,天問(wèn)大模型實(shí)戰(zhàn)效果優(yōu)異
2023年下半年西部某省份曾經(jīng)出現(xiàn)過(guò)烈性犬傷人事件,如何快速生成烈性犬檢測(cè)算法、快速布控到城市公共區(qū)域,成為城運(yùn)中心工作人員的難題。如果采用常規(guī)深度學(xué)習(xí)的算法訓(xùn)練方法,要求數(shù)據(jù)搜集、標(biāo)注、訓(xùn)練,一個(gè)新算法的產(chǎn)生至少要半個(gè)月后,管理的時(shí)效性就沒(méi)有了。
而基于多模態(tài)大模型的算法訓(xùn)練就簡(jiǎn)單的多,預(yù)訓(xùn)練的大模型基座帶來(lái)近70%的準(zhǔn)確性,工作人員在預(yù)警處置的過(guò)程中簡(jiǎn)單點(diǎn)擊預(yù)警的對(duì)錯(cuò),不到5天的時(shí)間就可以完成超過(guò)90%的算法準(zhǔn)確率。現(xiàn)場(chǎng)生產(chǎn)新算法方面展現(xiàn)了驚人的速度和靈活性,有效保障了公共安全。這種以用戶(hù)需求為核心,以技術(shù)創(chuàng)新為驅(qū)動(dòng)的策略,是推動(dòng)AI 2.0發(fā)展的關(guān)鍵動(dòng)力。預(yù)計(jì)未來(lái)智能安防的大模型將在更多細(xì)分市場(chǎng)和復(fù)雜場(chǎng)景中發(fā)揮關(guān)鍵作用,特別是在需要高度個(gè)性化和動(dòng)態(tài)適應(yīng)性的場(chǎng)景中,大模型的應(yīng)用將更具潛力。
依圖科技多模態(tài)大模型的推出,使視覺(jué)和語(yǔ)言的模型歸一,統(tǒng)一了物理世界和認(rèn)知世界的底層框架,讓多模態(tài)的信息之間可以無(wú)差別表示和無(wú)縫轉(zhuǎn)換,為大模型的人機(jī)交互模式、產(chǎn)品迭代模式、服務(wù)運(yùn)營(yíng)模式都提供了更多的可能性。AI 2.0走向安全生產(chǎn),走向基于數(shù)據(jù)和算力驅(qū)動(dòng)的智慧運(yùn)營(yíng),這無(wú)疑是未來(lái)安防行業(yè)發(fā)展的方向。