智能語音時代到來,誰在定義新時代AI? | 人人都是產品經理

編輯導語:智能音箱市場已經有多個玩家進入瓜分,阿里、小米、百度等都交出了各自的智能語音「答卷」。只是,當下的智能音箱是否真的足夠「智能」?玩家們又該如何定義當前市場,搭建合理的智能生態?本文作者做了對應解讀,一起來看看吧。

概要

人工智慧技術風靡多年,比起唬人的虛幻概念,智能音箱是為數不多進入尋常百姓家的真實商品。不算太高的價格、簡單易用的功能,讓它迅速佔據普通人的客廳和床頭。如同重複過很多遍的故事那樣,智能音箱從初創走向成熟、從固有模式中尋求變革,且依舊沒有停下探尋著未來的步伐。

  1. 滿足用戶交互需求,語音識別不斷成熟;
  2. 豐富產品功能範圍,高端和智能化破局;
  3. 從分散走向整體,自建智能硬體生態。

新一代交互終端、深入家庭空間的流量入口、環境智能化的開啟者……這些都是智能音箱的別稱,但當你問小度或者小愛一個問題時,得到的回答可能卻是「對不起,我沒有聽懂你在說什麼」。

作為邁向智能家居的先導產品,智能音箱背負著太多概念,但現有的技術和功能是否能夠支撐起這些概念,卻被打上一個大大的問號。

三足鼎立的阿里、百度、小米,試圖瓜分市場的新品牌,智能音箱市場未來何在?激烈廝殺后,哪些功能仍有可能的增長空間?

一、滿足用戶交互需求,語音識別不斷成熟

2014年,亞馬遜發布首款智能音箱Echo,兩周內出貨量破百萬台。隨後,多家互聯網科技公司下場,智能音箱市場陷入混戰。2017年,小米在生態大會上發布智能音箱產品「小愛同學」,智能音箱產品的戰火燃到中國市場。

五年後的今天,小愛同學、小度小度和天貓精靈走入千家萬戶,佔據的市場份額已超過95%,三足鼎立的態勢已然形成。但能否回答「主人」的問題,智能音箱們仍需取決於要求是否複雜、語法是否正確、發音是否標準。

實際上,現有的更多用戶傾向於讓家中的小愛同學或是天貓精靈完成機械性的指令。這些機械系指令包括唱歌、開燈、定時等,因為指令明確且往往只有一兩個辭彙,智能音箱很少會在完成這些指令時犯錯。

而對於稍複雜的指令,由於語音識別和NLP(自然語言處理)的不成熟,無論是用戶輸入的信息被機器識別,還是識別後的文本進行處理和理解,對於現有的智能音箱來說仍舊存在困難。尤其是中國市場方言的存在,為語音識別帶來了更大的困難。

2011年,微軟提出的基於上下文相關深度神經網路和隱馬爾科夫模型,使智能語音演算法得到長足優化。從海外市場看,以谷歌、微軟、亞馬遜為代表的巨頭已經開發出具備人類級別的語音識別系統,以深度神經網路演算法取代傳統模型后,語音識別的單詞錯誤率每年下降約18%。

相比於早期的智能音箱,海外廠商在語音識別和流暢度上層面上進行了技術精進,中國的智能音箱廠商也在交互和識別層面進行了大量探索和創新。

在交互領域,第一次讓一問一答的生硬場景發生改變的,是小度智能音箱於2018年6月首次發布的極客模式(連續對話技術)。極客模式實現了人與智能音箱連續對話,改善了此前人機交互中無法多輪對話、多次重複喚醒的體驗和回答生硬等問題。

而2019年出現的全雙工免喚醒能力,則實現了「一次喚醒,多輪交互」,還能在與他人對話的同時互不干擾地實現人機交互,進一步提升音箱的理解和表達能力,擴大應用場景。

此後,國內頭部智能音箱品牌都在交互形式多樣化上展開了探索,如2020年3月份,小愛同學開始將手勢控制運用到新推出的Redmi小愛觸屏音箱上。可以預見,除了愈加精準的識別能力,多模態交互也可能成為未來人機交互的主流。

二、豐富產品功能範圍,高端和智能化破局

根據艾瑞諮詢2021年報告,智能音箱用戶使用量最高的功能是播放音樂,佔比達69%;其次是詢問天氣、播報新聞、播放故事和設定鬧鐘。這些被高頻使用的功能,都是國內智能音箱在誕生之初就具備的。

因此,智能音箱的根本性技術需要革新,基礎功能外的新增長點也需要發掘。自誕生以來沒有明顯突破的智能音箱,亟待顛覆性的新技術,讓用戶改變「新奇有趣」的初印象,用更嚴肅的目光看待產品。因此,產品分離出兩條進化路線。

一部分產品選擇向高端進軍,追求音質和品質。

比如2019年,華為與帝瓦雷聯手推出了華為Sound系列高端智能音箱,近日其還將發布新品Sound Joy,採用4單元2分頻聲學系統,包括柔性絲質材質的球頂形振膜和輕量化碳纖維複合振膜。小米2021年則與哈曼卡頓合作,發布了旗下首款高端音箱Xiaomi Sound。

另一部分產品則注重提升智能化體驗。

首先,知識體系的構建是觸發智能音箱新功能的嘗試。對於百度來說,在搜索模型中運用的海量用戶行為信號和演算法能力,可以成為小度音箱演算法調優的基礎;而百科、百家號等體系沉澱下的文本內容,則能夠成小度小度回答問題時的海量召回池。

從場景上看,教育場景也確實是新的增長點,智能音箱的助教、育兒功能一直是廠商的重要宣傳點。特別是近兩年疫情影響下在線教育加速普及,智能音箱廠商加速相關布局。華為小精靈兒童智慧屏、天貓精靈CC10等產品,主打賣點都定在了教育功能。

其次,越來越多帶屏音箱出現在市場。小度系列通過帶屏音箱實現銷量反超,阿里和小米最新的產品形態同樣是觸屏音箱,如天貓精靈V10、小米小愛觸屏音箱Pro 8。智能音箱從語音交互走向語音視覺交互,說明智能語音技術的發展還未抵達顛覆性時刻,文字/視覺/觸覺的交互形態或許是突破技術瓶頸的捷徑,也可能是觸發新場景、新功能的動力。

這些嘗試同樣打開了新的消費場景,如果說語音交互可以提供播放音樂、對話類的娛樂功能;那麼屏幕的出現則為智能音箱打開了遊戲、影音、閱讀的更多可能性,只要有對應的內容資源支持,理論上其體驗與平板電腦無異。

受制於原有的有限功能和場景,音箱廠商一直在尋求突破口。產品存在的優化空間即是增長動力,也正是「幹掉」試錯的自己后,智能音箱才能迎來新生。

三、從分散走向整體,自建智能硬體生態

智能音箱的主要功能包括語音交互、內容服務、互聯網服務和智能家居控制四個部分,語音交互和智能家居控制功能的實現,使智能音箱成為全屋智能的入口。因此,對於頭部公司來說,智能音箱僅僅是其智能化宏大版圖的先行者。

雖然,動輒上千元的配套設施勸退大量普通消費者,但成套智能家居系統並非停留在概念層面。事實上,包括全季、亞朵、秋果在內的商務連鎖酒店早就以智能音箱為核心,建立起一整套智能居住系統,智能音箱們聯結起的智能化家居版圖正逐漸滲透進市場。

隨意走進一家商場里的小米之家,烤箱、空氣凈化器、電視擺在顯眼位置,讓人誤以為置身於一家微型電器城,小愛同學和其他智能家居產品的聯動效應依託於成熟的配套體系,強大、完善的硬體生態鏈體系也為小米智能音箱產品創造了良好的競爭優勢。

具體來看,在小米的整個生態中,其「1+4+N」AIoT戰略就是將小愛同學作為交互中心,將小米空調、烤箱、掃地機器人、洗衣機、檯燈、冰箱等種類繁多的家電,納入同一個家庭智能系統中。

而對於供應鏈優勢不那麼明顯的百度和阿里來說,發揮互聯網頭部企業的優勢,依託外部強大的智能設備合作網是其發力的重點,它們依託外部強大的智能設備合作網路,將智能音箱接入更多非品牌旗下的智能設備。

2021年,天貓精靈官方公布的接入品牌超過1000個,智能產品超過5000款,可連接智能家居設備超2億;小度智能音箱可連接家電品牌超200家。

中國智能音箱行業的三大龍頭紛紛推動智能音箱生態鏈功能形成,可見產品生態鏈形成對於智能音箱需求促進起著重要作用。而從另一面看,智能家居的體驗升級與入口設備的進化緊密相關,音箱不得不更多地承擔起「聯結」的智能。

從這個層面上看,智能音箱與音箱漸行漸遠,作為智能家居的入口之一,智能音箱正在以全新的產品形態面向消費者。

面對未來的智能家居以及更多的智能場景,智能音箱或許只是一個進入的通道。但是否能夠打破電子設備、消費電器、移動設備之間的壁壘,使它們能夠充分融合、互通,更容易地共享資源,將是智能音箱要背負的更重要的責任。