語音識別作為人工智慧發展最早、且率先商業化的技術,近幾年來隨著深度學習技術的突破,識別準確率大幅提升,帶動了一波產業熱潮。以下對語音識別發展趨勢分析。
語言是人類思想最重要的載體,是人們交流最有效、最方便、最自然的方式。語音識別技術就是讓機器接收,識別和理解語音信號,並將其轉換成相應數位訊號的技術。語音識別是涉及很多學科的一門交叉學科,涉及到聲學、語音語言學、數理統計、信息理論、機器學習以及人工智慧等學科。語音識別系統可以把操作人員的大量重複勞動交給機器來處理,節約了人力,提高了效益。例如:專家諮詢系統、信息服務系統、自然語音識別系統、尋呼服務、故障服務、智能對話查詢系統、語音訂票系統等。在某些惡劣環境和對人身有傷害的特殊環境下,例如地下、深水、輻射或高溫等地方,就可以通過語音識別系統發布指令,讓機器完成各種工作。
近三十年來,語音識別技術發展迅速,逐漸從實驗室走向市場,形成產品。在信息處理、通信與電子系統、自動控制等領域相繼出現了不同用途的語音識別系統,已經逐漸顯露出其強大的技術優勢和生命力。現在實際中應用比較廣泛的語音識別軟體有:Nuance、IBM公司的Viavoice、Android系統下的Voice Actions、蘋果手機上的Siri以及國內科大訊飛的語音識別產品等。我們國家對語音識別研究一直比較重視,中科院自動化所、清華大學、科大訊飛等很多科研院所和企業都投入了大量的人員和資金進行語音識別的研究開發。
在智能家居,不管是智能家電還是,語音識別技術都是必備的基本功能之一。據知名市場調研公司《Markets And Markets》發布的調查報告稱,全球智能家居市場規模將在2022年達到1220億美元,2016-2022年年均增長率預測為14%。而在機器人方面,研究機構IDC預測,至2020年,全球機器人與相關服務市場規模將由2016年的915億美元增至1880億美元。從這兩點數據來看,可想而知未來智能家居的市場之大。
在控制方式上,除了部分智能家電之外,語音控制已經成為了市場的主流,而這就是語音識別市場的商機。未來,作為人機自然交互的前提之一,語音識別必然是智能家居的發展趨勢,只有語音識別的準確率接近完美,人機的自然交互才能繼續開展。在智能家居市場的推動下,語音識別技術必將成為重點發展對象。
語音識別技術發展到今天,特別是中小詞彙量非特定人語音識別系統識別精度已經大於98%,對特定人語音識別系統的識別精度就更高。這些技術已經能 夠滿足通常應用的要求。由於大規模集成電路技術的發展,這些複雜的語音識別系統也已經完全可以製成專用晶片,大量生產。在西方經濟已開發國家,大量的語音識 別產品已經進入市場和服務領域。一些用戶交機、電話機、手機已經包含了語音識別撥號功能,還有語音記事本、語音智能玩具等產品也包括語音識別與語音合成功 能。人們可以通過電話網絡用語音識別口語對話系統查詢有關的機票、旅遊、銀行信息,並且取得很好的結果。調查統計表明多達85%以上的人對語音識別的信息 查詢服務系統的性能表示滿意。
可以預測在近五到十年內,語音識別系統的應用將更加廣泛。各種各樣的語音識別系統產品將出現在市場上。人們也將調整自己的說話方式以適應各種各樣 的識別系統。在短期內還不可能造出具有和人相比擬的語音識別系統,要建成這樣一個系統仍然是人類面臨的一個大的挑戰,我們只能一步步朝著改進語音識別系統 的方向一步步地前進。至於什麼時候可以建立一個像人一樣完善的語音識別系統則是很難預測的。就像在60年代,誰又能預測今天超大規模集成電路技術會對我們 的社會產生這麼大的影響。
語音識別遇到的困難
目前,語音識別研究工作進展緩慢,困難具體表現在:
(一)語音識別系統對環境敏感,採集到的語音訓練系統只能應用於與之對應的環境,而且當用戶輸入錯誤時不能正確響應,應用起來相對困難;
(二)必須採取新的新號處理方法來處理人在高噪聲環境下的發音變化的問題;(三)語言模型、語法及詞法模型在中、大詞彙量連續語音識別中無法正確、合理的運用,需要有效地利用語言學、心理學及生理學等方面的研究成果;現階段的科學技術對人類生理學諸如聽覺系統分析理解功能、大腦神經系統的控制功能等還不夠,更無法應用於語音識別;語音識別系統從實驗室演示系統向商品的轉化過程中還有許多具體細節技術問題需要解決。
如今,語音識別從算法到模型都有了質的變化,在加上語音領域(語音合成等)的其他研究,語音技術陸續進入工業、家庭機器人、通信、車載導航等各個領域中。當有一天,機器能夠真正「理解」人類語言,並作出回應,那時我們必將迎來一個嶄新的時代。以上對語音識別發展趨勢分析。
更多語音識別行業研究分析,詳見中國報告大廳《語音識別行業報告匯總》。這裡匯聚海量專業資料,深度剖析各行業發展態勢與趨勢,為您的決策提供堅實依據。
更多詳細的行業數據盡在【資料庫】,涵蓋了宏觀數據、產量數據、進出口數據、價格數據及上市公司財務數據等各類型數據內容。