知識圖譜如何讓「人工智慧」更智能?

本文將帶讀者一起探討兩個話題——人工智慧不智能的點在哪裡,基於知識圖譜的認知智能怎麼就變得智能了。

一、為什麼人人都談論的人工智慧是不智能的?

1. 自動駕駛這個行業所存在的問題

我們一起先來聊聊自動駕駛這個話題,先說下結論,無論是自動駕駛、機器人還是人工智慧的任何領域都高度依賴於歷史的數據,並且只能完成單項或者部分多項的協同任務,全部處於弱人工智慧的階段。

(1)產業及技術

從自動駕駛的產業鏈的體系中我們可以看到,這個行業大概會有3部分組成,感知端-客戶端-雲端。

  1. 感知端:時刻通過高精度的感測器及視覺設備感知定位所處的環境,根據環境做出決策,提取相關的數據,自動駕駛高度依賴各式的感測器,而多感測器融合的問題一直未解決;
  2. 客戶端:主要包含操作系統及硬體平台,通過演算法及底層晶元實時處理前端的數據,滿足自動駕駛實時可靠性的需求,晶元處理及時延的問題也暫未解決,這個問題有望在5G的時代解決;
  3. 雲端:主要用來存儲模擬高精度地圖繪製,為決策提供依據;

(2)自動駕駛等級

而在行業裡面大家把自動駕駛分為5個級別L0-L5,而目前為止即使像谷歌和百度這樣的頭部公司,重金砸到了自動駕駛這個領域,目前也只能處在L3的級別,而其他研究自動駕駛的公司處在L2階段。

而且有部分人認為自動駕駛要達到L5這個級別是不可能的,因為人工智慧永遠處理不了意外,而意外是歷史數據包含不了的。

(3)用戶使用(不安全)

2016年,特斯拉因自動駕駛未識別白色汽車導致駕駛事故;2016年的uber自動駕駛全球首例自動駕駛死亡事件;這樣的事件還有很多,對用戶來講自動駕駛,至少現在它是不安全的。

所以單從目前的人工智慧來說,數據-技術-應用都或多或少出現了很多問題,而過度依賴歷史的數據這個人工智慧最大的問題。

2. 現階段的人工智慧是什麼水平?

AI項目投入:企業在AI項目上的投入是反應AI價值的一個維度,相比於製造和互聯網行業,金融行業在AI上的投入最大

成熟度:從技術及業務成熟度的角度分析,單拿金融行業來說,反欺詐、生物識別驗證、智能客服這3項是在金融行業已成熟落地的場景,相比如其他行業應用最為成熟,其中金融行業最大的一點得益於金融行業在線化的數據,這也是AI可以快速落地的前提條件。

市場角度:從市場的角度來看,人工智慧行業按照平台及市場的劃分,已經形成頭部及垂直行業的企業,不同角度的競爭及協作角度將快速促進這個行業的大力發展。

二、基於認知計算的知識圖譜會變得智能嗎?

1. 結論是正面的

直接給出結論:是的,而且是質的改變,知識圖譜開始不再過分依賴於已有的歷史數據了,比如精準營銷,以前的精準營銷服務,是基於已知數據做的,而實際情況往往獲取不到那麼多的數據來進行分析,而圖譜開始利用知識推理來猜測用戶的喜好。還有一點,圖譜開始破壞人和機器反事實的狀態了(這一點在後續的文章中再闡述)。

(1)數據、信息、知識、智慧

為了更好的了解知識圖譜這項技術,我們先得知道數據、信息、知識、智慧這4個詞的含義,它們之接的關係像一個金字塔一樣,數據是形成信息、知識和智能的原材料,數據的量非常大,信息的量要小一些

舉個例子,我們人和人直接的相處,從陌生人開始接觸對方這個人的言談和舉止都可以當做數據,但是當過一段時間后,你會對這個人有個鮮明的標籤,比如這個人很努力,很靠譜,努力和靠譜就是信息了,所以數據是非指向性、非結構性的,信息是有指向性和結構性的;

而知識是在信息基礎之上,那些被人們廣泛接受並且成為共識的東西,而智慧其實是使用知識的這個人利用知識解決了某項問題就說這個人很有智慧。

從某種意義上來說,知識圖譜是人工智慧變的更加智能的必經階段。

(2)從AI技術的方向去看知識圖譜

從目前2019的技術成熟度來看,這項技術很快就會成為行業熱點,而且對圖譜技術的投資也會加大。

2. 舉例

我們以一個智能問答的例子作為切入,基於知識圖譜的智能問答應該是什麼樣子的。

(1)智能問答新趨勢

目前智能問答這個領域大概經歷了3個階段,從傳統的資料庫檢索到信息檢索也就是智能客服類的機器人,再到以知識圖譜建設為主知識型的問答機器人。

(2)從用戶角度出發

而所有的無論是現在行業里聽到的實體機器人、在線客服、智能語音導航、外呼這些新名詞最終都可以歸結為問答這個領域,而最主要對問答對象起到的不外乎客戶維繫以及客戶提升這兩方面的作用。

(3)技術組成

一個完整的問答系統,離不開的底層技術,包括NLP、ASR、TTS,而知識圖譜在知識庫構建及問答中才剛剛發揮作用。

智能外呼 智能X導航 智能質檢

(4)智能服務機器人

實體機器人智能問答系統通過智能硬體作為載體實現真實的銀行業務場景。

智能機器人與線上政務結合

(5)知識圖譜與智能知識庫

在知識庫構建層面,目前主要還是以FAQ為主,未來基於知識圖譜技術的知識庫構建將發揮重要的作用。

(6)基於深度學習的圖譜問答構成

主要會有兩個方面,一種是利用深度學習對傳統的方法進行改進,另一種就是基於深度學習端到端的問答構建。

框架演算法設計:

利用LSTM進行實體模塊兒識別,對傳統的實體識別及關係映射進行改進:

基於深度學習的卷積神經網路

端到端的深度學習問答模型,將問題和知識庫中的信息均轉化為向量表示,通過向量間的相似度計算方式完成用戶問題與知識庫答案的匹配,進一步提升了問答的準確性。

最終問答的整體技術架構是基於多策略的統一問答,讓問答更精準,問題覆蓋更廣。

整體的工作流程:從問題輸入意圖識別再到答案融合與生成。

回到現實,對於企業來說,無論是現在熱議的新冠疫情還是本身技術發展階段帶來的一系列問題,對企業來說都蘊含著「危」和「機」,而在此次社會問題出現的時候,我想會加速催化產業的重組及技術的創新,政府也會在人工智慧、5G這些高新技術上加大投資,我想未來是可期的。

對個人而言,我蠻喜歡羅胖跨年演講中的一句話,疫情也好金融危機也罷,這就是我輩要解決的問題,「直面現實,躬身入局」。