語音交互在車載場景中的應用 | 人人都是產品經理

汽車駕駛體驗的智能化升級下,車載場景內容的語音交互場景、產品形態都在不斷變更、不斷升級。而未來它究竟發展地怎麼樣呢?讓我們拭目以待。

汽車駕駛體驗的智能化升級

自動駕駛技術可謂是當今最為熱門的一個話題,同時也是人工智慧技術實現落地的重要場景之一。目前我們距離機器全自動駕駛技術的實現還有一定的距離。不過,在自動駕駛技術完全實現之前,人工智慧將會首先升級汽車的駕駛體驗。本文將嘗試梳理語音交互在車載場景中的應用,向讀者介紹目前智能駕駛艙和車載語音助手的現狀,以及未來的發展趨勢。

智能駕駛艙是一個基於人工智慧技術實現的概念。它是車載場景中智能駕駛輔助與智能機械化功能控制的結合,主要應用包括汽車娛樂,安全駕駛,自動駕駛和智能導航。

智能車載助手是智能駕駛艙的核心應用,用戶能夠通過語音與車輛交互。車載智能助手藉助最前沿的人工智慧技術,為汽車賦予「智能」,使其能夠更好的理解駕駛者的需求並為其提供服務。 隨著技術的不斷發展,科幻電影中的場景正在變為現實。

市場規模

隨著信息技術,智能系統以及互聯網的發展,以語音交互為主的智能駕駛艙概念正在全方面進入應用落地以及投產的高峰。

根據Analysys報告指出,中國的智能駕乘用車的市場佔有率已達到了15%,這個數字也將隨著全球範圍內國家政策的相繼推出而進一步增長。根據不完全統計,中國的智能駕駛艙市場規模有望在2020年達到1214億元,而其2016-2020年的年均增長率則可預計達到25%。

目前,國內外企業普遍看好智能駕駛艙的市場前景,並已開始在產業鏈各個環節進行布局,以在後續發展中搶佔先機。不僅福特,豐田,本田等傳統汽車製造行業開始推出整車智能駕駛艙戰略,三星,谷歌,蘋果等高科技公司也開始發布服務於汽車製造商的智能駕駛艙解決方案

前沿技術

由於在駕駛過程中,駕駛員的手和眼睛都被任務所佔據,因此車載場景對於語音的免提交互功能有更高的要求。而人工智慧技術恰恰能夠幫駕駛者實現與汽車之間的語音交互。

智能駕駛艙通過自然語言理解,語音識別,文字轉化語音(TTS),語義解析等技術,將車載語音助手,智能車載多媒體中心和自動化汽車安全維護系統相結合,以實現智能化駕駛體驗。

語音交互

可通過語音識別技術和文字轉語音技術將語音聲波轉化成文字信息進行解析,之後再將解析生成好的內容轉化文字信息傳達給駕駛員,從而實現語音交互。麥克風陣列技術可以幫助語音識別系統在特殊的駕駛環境下降低特殊的噪音干擾,以提高語音識別的正確率。

語義理解

自然語言處理技術會對識別到的用戶指令進行解析,解析后通過對話管理系統檢索適當的回復內容,再通過對話生成系統將答案生成。在車載場景下,可以通過任務型對話系統搭建對話流,通過限定意圖下的詞槽補全形式和追問內容編輯,實現自然的多輪對話。

狀態識別

以深度學習為基礎,結合計算機視覺,語音識別等技術根據駕駛員的表情和聲調來判斷駕駛員的精神狀況並提醒駕駛員保持清醒,避免危險駕駛。

通過學習掌握駕駛員的生活方式和喜好,根據不同的情況向駕駛員提出方案選項,真正變成駕駛員在駕駛過程中得力的助手,實現駕駛員與移動工具的自然交流。

場景與應用

汽車駕駛艙的核心要素是便利,安全和愉悅。圍繞著這三個要素, 汽車駕駛艙引申出許多應用場景,而其中正在被人工智慧技術所賦能包括以下五類:多媒體娛樂,車輛控制,智能導航,駕駛行為監控,車況監控。

(由於智能駕駛艙雖涉及的相關汽車製造領域場景繁多,本篇文章只包含部分有應用案例落地並投產的領域與場景,故並未囊括如晶元製造,感測器監控等熱門場景)

在多媒體娛樂方面:

播放音樂,廣播電台或播客的能力是智能語音助理最常見的用例之一。 特別是在開車時,人們喜歡聽一些音頻節目。 這為汽車製造商,娛樂場所和語音助理提供商提供了一個推廣車輛使用案例的機會。除了簡單的播放,暫停和切換歌曲等功能外,還有更多個性化的功能尚待開發。 例如,快速選擇要收聽的內容,或播放音頻的指定內容的一部分。

在車輛控制功能方面

基本功能包括調節車內空調溫度,調整車窗,調整後視鏡,甚至可以切換駕駛模式,變換檔位。智能車輛控制系統可以幫助駕駛者更加自如的掌控汽車,讓駕駛者將注意力集中在汽車駕駛的任務上,從而提高駕駛汽車的安全性。

不過,像變換檔位這樣的功能實現起來相對難度較大,需要一套新的,有效的交互設計方案,以確保新交互的安全性和有效性。

在智能導航方面

語音交互只是一個實現功能的入口,系統會理解駕駛員的語音指令,並提供有效的導航服務。

除了被動的幫助駕駛員提供導航服務之外,智能導航系統還可以為駕駛者提供目的地推薦和行程規劃的服務。導航系統將整合工作單位,餐廳,商場,遊樂場所,以及旅遊景點的數據信息,自動為駕駛者安排行程規劃供駕駛者參考。汽車將會為其駕駛者量身定製生活規劃服務,將便捷與高效的生活方式帶給其主人。

在駕駛行為監控方面

汽車可以通過對駕駛者面部狀態的識別而判斷其精神狀態,在適當的時候提醒駕駛者打起精神,以避免交通事故的發生。

除了面部狀態識別之外,還可以對司機駕駛汽車的時長,駕駛行為表現等數據進行分析。如果發現駕駛者的駕駛時間過長,或是頻繁出現壓線行駛和緊急剎車等情況,汽車也會及時的給予駕駛者語音反饋,使其保持清醒。

在車況監控方面

駕駛者在駕駛過程中可以隨時與汽車進行交談並詢問有關車輛狀況的任何信息,包括汽車每個模塊的性能和狀態,如車輪的胎壓,水箱的溫度,冷卻劑和機油的水平等。

實時的監控可以幫助駕駛者發現汽車的問題,並及時的作出恰當的處理,避免意外的發生。

另外,當汽車自己檢測到問題時,會主動以語音交互的形式提醒駕駛者。

產品形態

智能駕駛艙系統的產品形態分為三個部分:

  1. 汽車廠和汽車製造商,將先進的技術應用到汽車的駕駛艙中。
  2. 科技巨頭,為駕駛場景提供最尖端的語音交互解決方案和人工智慧服務。
  3. 創業公司,開發各種智能駕駛相關的便攜硬體和軟體服務。

這三類產品形態各有千秋,同時也都存在著各自的問題和短板。

傳統車廠:內置智能系統

許多大型汽車製造商都在嘗試獨立開發自己的智能駕駛解決方案。在提高汽車性能的同時,汽車製造商也在努力改善駕駛艙內的體驗,以提高市場競爭力。

車廠開發的技術可以更好地與汽車兼容,然而,汽車廠沒有強大的相關研發能力,語音交互相關的人工智慧技術並不是汽車廠強項。 因此,汽車廠開發的解決方案相對簡單,缺乏創新。

科技巨頭:平台解決方案

目前,幾乎所有科技巨頭公司都在為汽車提供智能駕駛解決方案,例如,蘋果、谷歌、亞馬遜、Nuance、阿里巴巴和百度都為智能駕駛艙創建了平台和操作系統。與大型科技公司的合作對於汽車製造商來說是一個很好的選擇。平台和系統可以將其技術和服務集成到汽車專用操作系統中,為汽車駕駛員提供完整的智能駕駛體驗。

技術巨頭憑藉其先進的技術研發能力和與汽車製造商的緊密合作,有效的優化了相關產品和服務的質量。 但是,為了快速搶佔市場,科技巨頭公司通常更願意提供通用類型的平台服務,很難為不同的車廠提供定製化服務。

初創公司:軟/硬體服務

有許多初創公司也在為汽車提供智能駕駛體驗或相關服務。

初創公司提供的服務通常包括兩個部分:外部集成硬體與軟體應用程序。常見的方法是,通過將外部硬體與汽車連接,在通過軟體服務來優化汽車駕駛艙的性能,將普通汽車變成智能汽車。

這些初創公司的服務和產品非常靈活,通常可以在指定的場景和特定的需求中為用戶提供定製化的服務。 然而,這類服務往往需要一些額外的操作和硬體設備的支持。另外,初創公司提供的技術解決方案與大部分汽車存在兼容性的限制。

結語

無論是汽車製造商,技術巨頭還是創業公司,都致力於為人們提供更安全,更易於操作和更多樣化的汽車駕駛體驗。汽車製造商在安全性和易操作性方面具有優勢,而技術公司在靈活性和多樣性方面做得更好。

從目前的發展趨勢來看,智能汽車駕駛艙的發展方向主要集中在三個方面:更大的屏幕,自動化的控制界面,以及語音交互。

目前智能車載系統的功能仍然非常有限。在垂直應用場景中,語音交互的體驗和技術的穩定性仍有很大的提升空間。隨著人工智慧技術的持續進步和5G網路技術的普及,智能汽車相關產業的上下游市場將會迎來前所未有的發展。智能駕駛艙會與自動駕駛解決方案共同顛覆汽車行業,而作為功能體驗入口的智能車載助手必將在未來幾年中成為語音交互,自然語言理解等人工智慧技術的重要落地場景。