進擊的速溶咖啡:當中國AI開始玩工業化 | 人人都是產品經理

編輯導語:隨著市場背景的變化、產業互聯網的提出與發展,當下我們對AI智能技術又提出了新的要求。AI工業化、產業化也許將逐漸成為行業常態。那麼,AI工業化可以在哪些領域得到實現?本篇文章里,作者就對幾種AI工業化的產品邏輯做了描述,讓我們一起來看一下。

從2017年AI藉助圍棋大規模出圈開始算起,我們經歷了這麼幾個階段的變化:

  • 第一階段,全社會一起討論AI到底有什麼用;
  • 第二階段,相關產學政各方一起討論,AI應該怎麼用;
  • 第三階段,負責出錢和收錢的雙方努力討論,AI怎麼用才能便宜點?

隨著產業化的推進,公眾範圍對AI的探討也隨之收窄。如今,基本看不到營銷號那些關於AI的驚悚標題,也很少有讓業界驚喜的底層演算法突破。

也許有人認為AI泡沫正在破裂,AI寒冬又將到來。但在大眾狂歡消退之餘,卻又能看到商用AI正在中國市場快速興起。

到了2021年,大部分雲計算和AI供應商似乎都無暇繼續討論AI的應用場景和應用可行性,而是專註於另一個關鍵詞:成本。

隨著AI開始變成企業服務的一種,部署成本過高開始變成業界最顯著的問題,而且在中國AI產業中尤甚。

與其他企業IT技術不同,AI作為一種靈活多變的軟體形態,需要長期投入和專業人才。這導致AI在大型科技公司或者平台型企業具有非常彈性的投資曲線,可以戰略性投入,從而靈活多變地解決各種問題。

但對於傳統企業、中小型企業、缺乏信息化基礎的企業來說,應用AI往往能在理論上解決非常重要的問題,卻缺乏直接、可操作且成本可控的執行方案。

回到雲計算和AI服務提供商這邊,雖然面向企業賣AI理論上潛力巨大。但現實是每家客戶都有大量需要定製解決的需求,往往要投入眾多行業專家、演算法架構師、軟硬體工程師來解決一些細小問題。這樣做出來的成果雖然可觀,但其實只具備案例性質,缺乏推廣可能。

另一方面,疫情導致美國AI行業創新緩慢,頭部公司演算法突破不理想。同時歐美的AI to B市場凈值較高,客戶數字化能力較強。谷歌雲、微軟雲的崛起雖然都與AI息息相關,但適配的更多是大規模、分散式的企業軟體市場。反而中國市場中的AI目標用戶更多是政企、實體經濟企業,需要一對一的AI能力與行業化的AI解決方案。

這種情況下,把AI技術推向高度工業化、標準化,就猛然間變成了中國科技界的獨立任務。雖然在2019年穀歌等頭部AI公司已經開始推動機器學習簡單化的相關技術,但其目標更多集中在所謂「AI民主化」,而非今天中國雲計算與AI廠商面向的大規模AI部署與工業級AI場景。

不誇張地說,低成本的AI工業化,已經成為目前中國AI產業的主線任務,但相關分析卻並不充沛。本文希望討論一下中國AI工業化這條賽道的幾種產品邏輯,以及代表案例、商業模型。由於各家廠商的命名方案與產品標準並不統一,為免誤會這裡選擇隱去具體的廠商與技術名稱。但將相關技術邏輯帶入到幾家大廠,不難發現聚焦程度已經不低。

看過東野圭吾《神探伽利略》系列的朋友,可能對主角湯川學鍾愛速溶咖啡鍾愛印象深刻。看似廉價、低端的速溶咖啡,其實凝結了噴霧乾燥等20世紀初人類科學與工業能力的精髓。也正是速溶咖啡的出現,才讓咖啡大規模生產、運輸、存儲成為可能。

如果說,深度學習是人類發現了咖啡這種飲料;那麼中國AI正在努力完成的,就是炮製出一杯進擊的速溶咖啡。

真正的咖啡時代,或許更可能開啟於後者。

一、行業知識圖譜

對於大部分企業用戶來說,AI提供的都是機器視覺、NLP體系下的幾種固定能力。基於這些能力衍生出企業的定製化變體複雜度很高。但有一種AI技術卻很容易與企業和行業的特殊需求進行適配,那就是知識圖譜。

知識圖譜的技術邏輯是將一些知識進行人為關聯,從而在調用A知識時驅動B知識,從而達成近乎「智能」的效果。

這並不是多麼新穎的技術,甚至早已機器學習誕生前,知識圖譜已經在很多領域有了廣泛應用。今天在搜索引擎和電商產品中的相關推薦功能,很大一部分都依靠知識圖譜來完成。

在AI to B的應用中,一個巨大問題在於企業處在特定行業里。每個行業不同的知識,或者說經驗,決定了應用AI的需求不同、成本各異。比如說,安防場景需要的AI識別,就和質檢場景大相徑庭。

因此一種新的AI產品服務模式,是技術供應商上升為行業信息化服務商,主動打造符合具體行業需求的知識圖譜產品。

比如工業知識圖譜里可能包含分揀、質檢、產品流程等方方面面,當工業識別解決方案與之結合,AI就不僅能夠完成單點任務,還可以依據行業知識圖譜完成一定程度的複雜需求,比如知識推理、知識預測等等。

類似的行業知識圖譜擁有廣泛的應用可能性,無論是在工業、能源這樣注重「經驗」的場景,還是金融、物流這樣看重「數據關係」的領域。

另外,行業知識圖譜也可以幫助AI打入那些通識類演算法難以奏效的行業,比如說油氣勘探、生物醫藥等等。最重要的是,如果雲計算廠商提供有效的行業知識圖譜服務,那麼就可以免除一個個訂單去給企業做知識、經驗適配,從而降低人工成本。

但行業知識圖譜的問題在於,行業知識是一個非常抽象、難以標準化的版圖。每個行業有多少知識可以取公約數也是個問題。

因此市面上的類似服務,都大體集中在金融、能源、工業質檢等幾個基礎板塊,難以細化到更具體、小眾的行業。

並且行業知識圖譜已經極大改變了雲計算、AI供應商的角色,使其從演算法等基礎能力提供商變成了行業諮詢、行業數字化解決方案提供商,這對商業模式和行業認可也提出了挑戰。

目前,與機器視覺、NLP等基礎能力適配的行業知識圖譜,還是中國AI界獨一份的產業板塊。它能走到多遠,或許是接下來AI產業一個非常重要的發展指示物。

二、自動機器學習

雖然蘇大強都知道手磨咖啡好喝,但讓每個人都去磨咖啡顯然不現實。速溶咖啡的價值也因此得到了確認。

這就像AI雖好,但每家企業都高價聘用演算法架構師,花費大量時間做數據調優、分類、提取也很不現實。

為了解決這個問題,谷歌早在2018年就推出了AutoML,也就是自動機器學習的相關工具。

這類工具的基礎邏輯在於,盡量讓普通開發者,甚至不會寫代碼的AI應用者,都能通過按要求上傳圖片的方式生成固定的AI模型。這些模型雖然簡單,但勝在零門檻、低成本。大眾熟知的類似應用,可能就是以給明星換臉而出圈的deepfake。當這東西被全球集體封殺,或許也側面證明了自動機器學習的威力。

隨著產業發展,自動機器學習也不再僅僅能做簡單的視頻處理。尤其隨著大廠的不斷投入,今天中國AI產業的自動機器學習平台與工具,在能力的多元化與工業化上已經遠遠超過了谷歌等美國公司。

廣義來看,從數據處理到數據特徵提取,再到數據調參和訓練,幾乎每一個AI步驟都可以在今天找到一些辦法來進行自動或半自動簡化。而國內幾大相關廠商也推出了自動機器學習平台的升級版,以此來提升複雜模型的開發效率,或者幫助進行行業化的AI落地。

在產業端,自動機器學習的最突出價值在於可以快速滲透那些缺乏AI、甚至缺乏信息化基礎、同時也無法進行定製化服務的微型領域。

比如說農業、醫療,甚至校園場景。即使缺乏AI能力甚至編程能力的個人開發者,也可以依靠自動機器學習平台很快完成一個簡單AI模型的開發,並且在手機、攝像頭等設備上完成部署。比如在一個案例中,農村扶貧幹部可以依靠類似平台快速開發一個識別房屋、果樹、農作物的軟體,從而加強扶貧工作標準化以及提升工作效率。

當然了,自動機器學習類軟體既然瞄準的是低門檻,那麼問題也隨之產生。這類平台的自動化能力,導致其往往難以處理複雜數據或者完成演算法創新。而一旦給平台加強更多技術能力,又容易變得更為專業複雜,不適配缺少技術能力的企業和開發者。其中的平衡點很難拿捏。

無論如何,近兩年我們在看到越來越多的工業級AI項目開始基於自動機器學習平台來搭建,AI開發的時間成本與人力成本也在極速下降。

這些真正面向解放生產力的升級,構成了中國AI的最佳風景。

三、大規模預訓練模型

說到工業級AI,那麼就不得不提AI應用的另兩個核心問題:數據量和訓練算力。

在工業、能源、金融、醫療這些行業中應用的AI,需求特徵是參數精度高、訓練數據需求量大。但問題也來了,一家傳統企業去哪搞那麼多數據,又哪來的算力進行長時間、需要複雜調參優化的模型訓練呢?

面對這個問題,業界也有個辦法。就是平台提供預訓練模式,然而企業買回去進行二次加工,從而生成自己想要的AI能力。這個邏輯很容易理解,有點像買熟食回家再二次烹飪一下。家裡人還是會誇你手藝好,誰又在乎前面98%的步驟都是在餐廳完成的呢?

在AI領域,這個用半成品再加工的邏輯被叫做遷移學習。其在大數據集訓練的預訓練模型上再完成小數據的遷移,最終在企業用戶時間、人力成本的基礎上,保證了模型的精度和使用效果。

大規模預訓練模型的邏輯很早就被提出,但近兩年在中國AI產業中開始不斷得到重視,形成了解決AI工業化的核心思路之一。一般來說,雲計算企業會提供NLP、機器視覺等主要品類的AI預訓練模型,或者重要行業、重要工作場景中的預訓練模型,供企業下載部署。一方面以此帶動企業用雲量,另一方面還可以衍生出更多的智能化解決方案服務。

預訓練模型這個領域的競爭主要集中在兩個方向。

  • 一是有效數據的參數規模和收斂精度,以此來決定模型在通用賽道上的能力指數;
  • 二是預訓練模型的行業細分度,以此來決定與行業、任務場景的適配廣度。

最典型的預訓練模型應用場景,應該是工業巡檢、質檢等領域。這些領域的絕大部分數據精度要求都是一樣的,就是識別能力的精準度。這個可以在雲計算廠商進行大數據預訓練。而廠商到底是要識別划痕還是識別污垢,就可以回到廠里進行遷移訓練來搞定。

最後說說問題,預訓練模型目前還更多屬於雲計算廠商提供的附加產品,不像基礎AI演算法一樣有穩定的市場空間。究竟其前景如何還有待檢驗。另外預訓練模型雖然比較受企業用戶的歡迎,但商業模式還有待探索,給供應商帶來的實際價值不太清晰。

四、結束語

當中國AI走到2021,工業級、產業級成為了三句不離口的關鍵詞。但真正具備工業化特徵的AI,其實就像齒輪、軸承、鋼筋一樣,是標準化、規模化、低成本的產物,而不是某種美好的智能魔法。

中國AI開始大面積擁抱工業化、流程化、標準化,也許將構成一個交叉點。這條賽道上的AI,不那麼受資本關注,理論上更接近企業IT而非傳統意義上的AI生態,至少一點也不極客,不夠酷炫。

但這條路很重要,或者可以說是全球AI產業的一個拐點。尤其重要的是,中國AI的前景,不能一直被美國AI的上限所制約。行業知識圖譜、自動機器學習這些東西其實都發源於美國,但在應用化、平台化和標準化上,美國AI並沒有中國業界來的乾脆有力度。

至少在今天看來,沉默前行的AI工業化是一條孤獨的路。

前方一無所有,也因此給人安慰。

#合作媒體#

腦極體,微信公眾號:腦極體。寫讓你腦洞大開且能看懂的人工智慧、流媒體、海外科技。

本文原創發佈於人人都是產品經理。未經許可,禁止轉載

題圖來自Unsplash,基於CC0協議

給作者打賞,鼓勵TA抓緊創作!

1人打賞