進擊的速溶咖啡：當中國AI開始玩工業化 | 人人都是產品經理

編輯導語：隨著市場背景的變化、產業互聯網的提出與發展，當下我們對AI智能技術又提出了新的要求。AI工業化、產業化也許將逐漸成為行業常態。那麼，AI工業化可以在哪些領域得到實現？本篇文章里，作者就對幾種AI工業化的產品邏輯做了描述，讓我們一起來看一下。

從2017年AI藉助圍棋大規模出圈開始算起，我們經歷了這麼幾個階段的變化：

第一階段，全社會一起討論AI到底有什麼用；
第二階段，相關產學政各方一起討論，AI應該怎麼用；
第三階段，負責出錢和收錢的雙方努力討論，AI怎麼用才能便宜點？

隨著產業化的推進，公眾範圍對AI的探討也隨之收窄。如今，基本看不到營銷號那些關於AI的驚悚標題，也很少有讓業界驚喜的底層演算法突破。

也許有人認為AI泡沫正在破裂，AI寒冬又將到來。但在大眾狂歡消退之餘，卻又能看到商用AI正在中國市場快速興起。

到了2021年，大部分雲計算和AI供應商似乎都無暇繼續討論AI的應用場景和應用可行性，而是專註於另一個關鍵詞：成本。

隨著AI開始變成企業服務的一種，部署成本過高開始變成業界最顯著的問題，而且在中國AI產業中尤甚。

與其他企業IT技術不同，AI作為一種靈活多變的軟體形態，需要長期投入和專業人才。這導致AI在大型科技公司或者平台型企業具有非常彈性的投資曲線，可以戰略性投入，從而靈活多變地解決各種問題。

但對於傳統企業、中小型企業、缺乏信息化基礎的企業來說，應用AI往往能在理論上解決非常重要的問題，卻缺乏直接、可操作且成本可控的執行方案。

回到雲計算和AI服務提供商這邊，雖然面向企業賣AI理論上潛力巨大。但現實是每家客戶都有大量需要定製解決的需求，往往要投入眾多行業專家、演算法架構師、軟硬體工程師來解決一些細小問題。這樣做出來的成果雖然可觀，但其實只具備案例性質，缺乏推廣可能。

另一方面，疫情導致美國AI行業創新緩慢，頭部公司演算法突破不理想。同時歐美的AI to B市場凈值較高，客戶數字化能力較強。谷歌雲、微軟雲的崛起雖然都與AI息息相關，但適配的更多是大規模、分散式的企業軟體市場。反而中國市場中的AI目標用戶更多是政企、實體經濟企業，需要一對一的AI能力與行業化的AI解決方案。

這種情況下，把AI技術推向高度工業化、標準化，就猛然間變成了中國科技界的獨立任務。雖然在2019年穀歌等頭部AI公司已經開始推動機器學習簡單化的相關技術，但其目標更多集中在所謂「AI民主化」，而非今天中國雲計算與AI廠商面向的大規模AI部署與工業級AI場景。

不誇張地說，低成本的AI工業化，已經成為目前中國AI產業的主線任務，但相關分析卻並不充沛。本文希望討論一下中國AI工業化這條賽道的幾種產品邏輯，以及代表案例、商業模型。由於各家廠商的命名方案與產品標準並不統一，為免誤會這裡選擇隱去具體的廠商與技術名稱。但將相關技術邏輯帶入到幾家大廠，不難發現聚焦程度已經不低。

看過東野圭吾《神探伽利略》系列的朋友，可能對主角湯川學鍾愛速溶咖啡鍾愛印象深刻。看似廉價、低端的速溶咖啡，其實凝結了噴霧乾燥等20世紀初人類科學與工業能力的精髓。也正是速溶咖啡的出現，才讓咖啡大規模生產、運輸、存儲成為可能。

如果說，深度學習是人類發現了咖啡這種飲料；那麼中國AI正在努力完成的，就是炮製出一杯進擊的速溶咖啡。

真正的咖啡時代，或許更可能開啟於後者。

一、行業知識圖譜

對於大部分企業用戶來說，AI提供的都是機器視覺、NLP體系下的幾種固定能力。基於這些能力衍生出企業的定製化變體複雜度很高。但有一種AI技術卻很容易與企業和行業的特殊需求進行適配，那就是知識圖譜。

知識圖譜的技術邏輯是將一些知識進行人為關聯，從而在調用A知識時驅動B知識，從而達成近乎「智能」的效果。

這並不是多麼新穎的技術，甚至早已機器學習誕生前，知識圖譜已經在很多領域有了廣泛應用。今天在搜索引擎和電商產品中的相關推薦功能，很大一部分都依靠知識圖譜來完成。

在AI to B的應用中，一個巨大問題在於企業處在特定行業里。每個行業不同的知識，或者說經驗，決定了應用AI的需求不同、成本各異。比如說，安防場景需要的AI識別，就和質檢場景大相徑庭。

因此一種新的AI產品服務模式，是技術供應商上升為行業信息化服務商，主動打造符合具體行業需求的知識圖譜產品。

比如工業知識圖譜里可能包含分揀、質檢、產品流程等方方面面，當工業識別解決方案與之結合，AI就不僅能夠完成單點任務，還可以依據行業知識圖譜完成一定程度的複雜需求，比如知識推理、知識預測等等。

類似的行業知識圖譜擁有廣泛的應用可能性，無論是在工業、能源這樣注重「經驗」的場景，還是金融、物流這樣看重「數據關係」的領域。

另外，行業知識圖譜也可以幫助AI打入那些通識類演算法難以奏效的行業，比如說油氣勘探、生物醫藥等等。最重要的是，如果雲計算廠商提供有效的行業知識圖譜服務，那麼就可以免除一個個訂單去給企業做知識、經驗適配，從而降低人工成本。

但行業知識圖譜的問題在於，行業知識是一個非常抽象、難以標準化的版圖。每個行業有多少知識可以取公約數也是個問題。

因此市面上的類似服務，都大體集中在金融、能源、工業質檢等幾個基礎板塊，難以細化到更具體、小眾的行業。

並且行業知識圖譜已經極大改變了雲計算、AI供應商的角色，使其從演算法等基礎能力提供商變成了行業諮詢、行業數字化解決方案提供商，這對商業模式和行業認可也提出了挑戰。

目前，與機器視覺、NLP等基礎能力適配的行業知識圖譜，還是中國AI界獨一份的產業板塊。它能走到多遠，或許是接下來AI產業一個非常重要的發展指示物。

二、自動機器學習

雖然蘇大強都知道手磨咖啡好喝，但讓每個人都去磨咖啡顯然不現實。速溶咖啡的價值也因此得到了確認。

這就像AI雖好，但每家企業都高價聘用演算法架構師，花費大量時間做數據調優、分類、提取也很不現實。

為了解決這個問題，谷歌早在2018年就推出了AutoML，也就是自動機器學習的相關工具。

這類工具的基礎邏輯在於，盡量讓普通開發者，甚至不會寫代碼的AI應用者，都能通過按要求上傳圖片的方式生成固定的AI模型。這些模型雖然簡單，但勝在零門檻、低成本。大眾熟知的類似應用，可能就是以給明星換臉而出圈的deepfake。當這東西被全球集體封殺，或許也側面證明了自動機器學習的威力。

隨著產業發展，自動機器學習也不再僅僅能做簡單的視頻處理。尤其隨著大廠的不斷投入，今天中國AI產業的自動機器學習平台與工具，在能力的多元化與工業化上已經遠遠超過了谷歌等美國公司。

廣義來看，從數據處理到數據特徵提取，再到數據調參和訓練，幾乎每一個AI步驟都可以在今天找到一些辦法來進行自動或半自動簡化。而國內幾大相關廠商也推出了自動機器學習平台的升級版，以此來提升複雜模型的開發效率，或者幫助進行行業化的AI落地。

在產業端，自動機器學習的最突出價值在於可以快速滲透那些缺乏AI、甚至缺乏信息化基礎、同時也無法進行定製化服務的微型領域。

比如說農業、醫療，甚至校園場景。即使缺乏AI能力甚至編程能力的個人開發者，也可以依靠自動機器學習平台很快完成一個簡單AI模型的開發，並且在手機、攝像頭等設備上完成部署。比如在一個案例中，農村扶貧幹部可以依靠類似平台快速開發一個識別房屋、果樹、農作物的軟體，從而加強扶貧工作標準化以及提升工作效率。

當然了，自動機器學習類軟體既然瞄準的是低門檻，那麼問題也隨之產生。這類平台的自動化能力，導致其往往難以處理複雜數據或者完成演算法創新。而一旦給平台加強更多技術能力，又容易變得更為專業複雜，不適配缺少技術能力的企業和開發者。其中的平衡點很難拿捏。

無論如何，近兩年我們在看到越來越多的工業級AI項目開始基於自動機器學習平台來搭建，AI開發的時間成本與人力成本也在極速下降。

這些真正面向解放生產力的升級，構成了中國AI的最佳風景。

三、大規模預訓練模型

說到工業級AI，那麼就不得不提AI應用的另兩個核心問題：數據量和訓練算力。

在工業、能源、金融、醫療這些行業中應用的AI，需求特徵是參數精度高、訓練數據需求量大。但問題也來了，一家傳統企業去哪搞那麼多數據，又哪來的算力進行長時間、需要複雜調參優化的模型訓練呢？

面對這個問題，業界也有個辦法。就是平台提供預訓練模式，然而企業買回去進行二次加工，從而生成自己想要的AI能力。這個邏輯很容易理解，有點像買熟食回家再二次烹飪一下。家裡人還是會誇你手藝好，誰又在乎前面98%的步驟都是在餐廳完成的呢？

在AI領域，這個用半成品再加工的邏輯被叫做遷移學習。其在大數據集訓練的預訓練模型上再完成小數據的遷移，最終在企業用戶時間、人力成本的基礎上，保證了模型的精度和使用效果。

大規模預訓練模型的邏輯很早就被提出，但近兩年在中國AI產業中開始不斷得到重視，形成了解決AI工業化的核心思路之一。一般來說，雲計算企業會提供NLP、機器視覺等主要品類的AI預訓練模型，或者重要行業、重要工作場景中的預訓練模型，供企業下載部署。一方面以此帶動企業用雲量，另一方面還可以衍生出更多的智能化解決方案服務。

預訓練模型這個領域的競爭主要集中在兩個方向。

一是有效數據的參數規模和收斂精度，以此來決定模型在通用賽道上的能力指數；
二是預訓練模型的行業細分度，以此來決定與行業、任務場景的適配廣度。

最典型的預訓練模型應用場景，應該是工業巡檢、質檢等領域。這些領域的絕大部分數據精度要求都是一樣的，就是識別能力的精準度。這個可以在雲計算廠商進行大數據預訓練。而廠商到底是要識別划痕還是識別污垢，就可以回到廠里進行遷移訓練來搞定。

最後說說問題，預訓練模型目前還更多屬於雲計算廠商提供的附加產品，不像基礎AI演算法一樣有穩定的市場空間。究竟其前景如何還有待檢驗。另外預訓練模型雖然比較受企業用戶的歡迎，但商業模式還有待探索，給供應商帶來的實際價值不太清晰。

四、結束語

當中國AI走到2021，工業級、產業級成為了三句不離口的關鍵詞。但真正具備工業化特徵的AI，其實就像齒輪、軸承、鋼筋一樣，是標準化、規模化、低成本的產物，而不是某種美好的智能魔法。

中國AI開始大面積擁抱工業化、流程化、標準化，也許將構成一個交叉點。這條賽道上的AI，不那麼受資本關注，理論上更接近企業IT而非傳統意義上的AI生態，至少一點也不極客，不夠酷炫。

但這條路很重要，或者可以說是全球AI產業的一個拐點。尤其重要的是，中國AI的前景，不能一直被美國AI的上限所制約。行業知識圖譜、自動機器學習這些東西其實都發源於美國，但在應用化、平台化和標準化上，美國AI並沒有中國業界來的乾脆有力度。

至少在今天看來，沉默前行的AI工業化是一條孤獨的路。

前方一無所有，也因此給人安慰。

#合作媒體#

腦極體，微信公眾號：腦極體。寫讓你腦洞大開且能看懂的人工智慧、流媒體、海外科技。

本文原創發佈於人人都是產品經理。未經許可，禁止轉載

題圖來自Unsplash，基於CC0協議

給作者打賞，鼓勵TA抓緊創作！

1人打賞