聯合智譜AI共同研發千億級大語言模型“360GLM”后,360集團大模型陣營中的另一角色——360智慧生活視覺大模型,也正式登場了。
近日,360集團宣布推出360智腦·視覺大模型,同時發布多款已“嵌入”該視覺大模型的智腦硬件新品,宣布360智慧生活正式進軍SMB市場,從家庭場景進一步跨入企業商用領域。
在與新浪財經溝通中,360視覺云業務線總經理孫浩指出,“上一波物聯網浪潮更多是解決數據問題,但更多的數據價值并沒有被充分挖掘,多模態大模型與物聯網的結合,能將物聯網感知的數據進一步融合、學習,產生更大的一個價值,這將會是下一個風口?!?/p>
從360智腦到視覺大模型,360的大模型的多模態技術能力正不斷得以延伸,而將大模型“嵌入”到智能硬件之上,360布的是怎樣一盤棋局?
“讓智能硬件具備靈魂”
近年來,隨著人工智能技術的發展,傳統深度學習算法在安防等物聯網場景中的局限性愈發凸顯。算法通用、場景不通用,無法以較低的邊際成本解決場景碎片化問題。與此同時,邊端算法受限、內存受限等問題,也限制了AI的進一步普及與落地。
相比之下,大模型有著更好地泛化能力,有望進一步突破傳統算法的精度與數據局限,解決傳統深度學習算法的數據依賴,這不僅能夠降低訓練研發成本,還可加快AI在垂直場景中的落地,很好地彌補傳統深度學習算法的局限。
因此,宣布推出360智腦·視覺大模型,也成為了360完善自身大模型“多模態”技術能力,同時基于安防等對于圖像視頻需求更多的垂直行業,打造行業大模型的重要一環。
據孫浩介紹,360智腦·視覺大模型現階段主要聚焦開放目標檢測(OVD)、圖像標題生成、視覺問答(VQA)三項能力。這三項能力可以在長尾目標檢測、巡店、看護、設備巡檢等場景中實現廣泛應用,對傳統深度學習算法形成很好的補充。
在360智腦·視覺大模型發布會現場,360集團創始人周鴻祎發言指出,“大語言模型攻克了認知層面的難題,大模型的出現標志著通用人工智能時代的到來。”而這也意味著,基于大模型的新一輪人工智能技術,已經具備了能夠“讀懂”圖片、視頻等文本以外的內容能力,讓人工智能技術從最初的視覺感知,進化到視覺認知層面。