語音識別發展突飛猛進
近年來,生物識別領域日趨升溫,語音識別技術取得顯著進步,開始加速從實驗室走向消費市場。眼下,語音助手、客服機器人、智能音箱等應用都用到了語音識別技術,家電、工業、金融、汽車電子等行業成為主要商業化場景。
在國內,語音識別技術的研發始于上世紀50年代,但是由于各方面條件限制,發展一直十分緩慢。到了80年代以后,隨著計算機等技術的發展與普及,國內外語音識別技術的研究都迎來了一股新熱潮。
進入新世紀,借助深度學習技術突破帶動的人工智能領域崛起,以及大數據等信息技術的進步,包括語音識別在內的生物識別技術取得了突飛猛進的發展。不少科技公司、互聯網企業都將語音識別視為進軍人工智能的橋頭堡,進一步促進了語音識別市場的巨大擴張。
當前,國外語音識別技術發展以蘋果、亞馬遜等企業為尊;而在國內,科大訊飛、BAT三巨頭、搜狗、盛大等公司也在積極布局語音識別技術,并研發、上市了一批相關產品。在這些公司以及資本市場的推動下,語音識別技術已然成為最為火熱的科技應用之一。
語音識別技術有得有失
在生物識別領域中,語音識別技術是應用最為成熟、使用最為便捷、商業化程度最高的一個細分領域之一。而語音識別技術之所以受到各大科技企業的關注和資本市場的青睞,就在于其所具有的一系列優勢:
一是語音采集較為方便,無需繁復配合、也幾乎不用動手,因而能夠吸引更多的消費者;二是語音識別技術應用成本較低,一般只需一個麥克風配合系統軟件,語音分析、辨別的算法復雜程度也較低;三是更符合消費者的期待與需求,較為適合智能家居等新興業態的發展趨勢。
當然,語音識別技術固然優勢多多,但是在當前階段依然存在著一些缺點,例如:每個人的聲音并不是一成不變,而是會隨著年齡的變化而變化;周邊的環境噪音對于語音的采集有一定干擾,距離因素也是采集過程中不能忽視的問題;另外,還有語音識別準確率及理解能力有待提升等不足都亟需予以重視,并逐步進行完善。
口音或方言是最大挑戰
無論是在國內還是國外,方言或是口音都是切實存在的,而這對于語音識別技術的應用和普及來說,無疑是最大挑戰。因為從經濟效益、商業化推廣等方面考慮,企業在研發階段,一般都是采用所在國最為主流的語言形式,但是在實際應用時,消費者的語言習慣卻并不一定符合預期設定。
一旦用戶有嚴重的口音,或是使用的方言不在識別范圍內,那么就會導致語音識別系統反應遲鈍、識別率降低,甚至完全無法識別,最終影響消費者的使用體驗,從而造成市場口碑受到質疑。很顯然,如果不能解決這一挑戰,語音識別的普及就將被限定在目前的瓶頸之中。
因此,針對口音和方言展開的新一輪語音識別技術研發,或將成為新的競爭焦點。可以預見,隨著識別語種的愈發豐富及準確率進一步提升,語音識別技術的普及程度將會再度提高,相關的產品將更為公眾所接受,語音識別市場的爆發也就可期了。