AIGC的「含科量」與「含資量」 | 人人都是產品經理

編輯導語:隨著時代的更迭、技術的演變,互聯網的內容生產逐漸出現了新的流行趨勢,即由AI生產內容(AIGC)。那麼,這類內容的生產是否能夠滿足用戶的需求,是否能夠替代人工內容生產帶給用戶的體驗?乘著元宇宙浪潮,AIGC這股風還能「吹」多遠?

2014年的時候,我在互聯網企業里做內容工作,當時業內很流行凱文·凱利的「一千個粉絲」理論,相信「找到一千個種子用戶,產品就能夠活下去」。

找到種子用戶幹嘛呢?核心KPI之一,就是鼓勵他們創造內容,提高平台的UGC數量與質量。

普通人也輕鬆能創作的圖文短視頻,用愛發電的同人衍生,極具創意的鬼畜視頻……UGC(User-generated content用戶生產內容),以高效、豐富、多元的產出方式,和PGC(Professional-generated content專家生產內容)、OGC(Occupationally-generated Content職業生產內容)一起,讓互聯網數字內容呈現出前所未有的繁榮多彩。

一個時代有一個時代的主題,如今業內流行的內容生產模式,則是AIGC。

AI-generated content,字面意思是AI生產內容。AI寫詩、AI作曲、AI繪畫、AI換臉……甚至有創始人認為,遊戲中導入圖片生成模型的「捏臉系統」都是AIGC。

那麼問題來了,讓AI替人舞文弄墨,對話交互問答、創意寫作、生成詩歌圖文或是以假亂真的視頻,不都是舊新聞了嚒,都屬於自然語言生成Natural Language Generation(NLG)的應用,是NLP自然語言處理技術的一大類任務,已經應用將近30年了。

怎麼突然就以AIGC的概念成為資本熱捧的對象呢?

故事恐怕還是要從「元宇宙」說起。

一、AIGC,到底生產的是什麼內容?

在內外網搜索 「AIGC」時,精準匹配的是簡體中文信息,而英文AI-generated content一詞,在海外平台主要還是以自動化生成文本的NLG技術為主。所以,AIGC應該是一個在中國率先流行起來的專有名詞。

AIGC的「含科量」與「含資量」

AIGC的「含科量」與「含資量」

目前為止,與AIGC相關的創作類型主要有三種:

1)內容平台的一種自動化作業方式,比如CCTV的AIGC平台,就包括智能采編、模板生成、畫質優化等等;部分語音類app,通過語音合成(TTS)技術,提供文本自動轉語音的能力;流媒體平台,通過演算法對畫面畫質進行優化,提高清晰度等等。

AIGC的「含科量」與「含資量」

2)AI科研機構的多模態應用,實現內容生成。比如中科院自動化所的跨模態通用人工智慧平「紫東太初」,就能夠做到「以圖生音」「以音生圖」。百度文心大模型的「AI畫家」,則在前不久的元宵節,生成與地點相匹配的專屬畫作。

3)科技企業及創業公司的數字人、虛擬人製作。通過自主開發、平台開發等形式,合成全新的人物形象,與用戶開展互動。比如AI手語主播,通過AI演算法將文本轉化為手語信息,為聽障朋友提供服務;品牌代言人,火星車數字人祝融號跟廣大用戶進行互動;虛擬偶像,通過生動的表情、動作、語言等展示才藝,與粉絲對話;以及智能客服、遊戲陪玩等等。

通過上述AIGC應用,或許不難理解,為什麼NLG往往依靠誇張新聞點(比如deepfake)偶爾進入大眾視野,而AIGC一詞出道即爆紅了。

二、小紅靠捧,大紅靠命:AIGC的「含科量」有多高?

如前所說,自然語言生成NLG作為AI創作內容的一種主流方式,此前在大部分時間內都是行業內自娛自樂,偶爾憑藉「換臉」之類的奇趣新聞火一把,但僅此而已。而AIGC這一概念,在當下能夠迅速走紅,可以說是時也、運也。

首先,深度學習技術本身不斷迭代,能夠生成更具個性化、擬人化的內容。

隨著自然語言處理技術的不斷發展,近年來AI的閱讀理解創作能力進步飛快,已經達到了驚人的水平,技術成熟給了AIGC廣泛應用的基礎。

隨著AI模型GPT-3的問世,機器已經能夠達到人類小學的閱讀寫作水平,頂級AI企業的中文普通話識別準確率能夠達到98%以上,多語言、小語種、方言的識別率也不斷升級。此外,情感計算、因果計算、知識圖譜、元學習等多種技術開始被引入深度學習,大幅改善了人機交互的自然感。

這些新成果應用在內容創作上,就是大家能看到AI寫出更流利通順的文章、用更自然的音色去朗讀一本書、更聲情並茂地跟人對話、對用戶輸入的語句理解得更準確,一句話,終於開始擺脫「人工智障」的標籤了。

第二,AI基礎設施不斷發展,多模態大模型的相繼成熟落地。

如果只是生成單一的內容,那麼AIGC或許還不至於讓見多識廣的大眾眼前一亮。而多模態大模型的出現,讓融合性創新成為可能。

多模態大模型,既需要具備NLP(自然語言理解)大模型、CV(計算機視覺)大模型等的能力,理解語言、視覺的內容,還要能夠跨模態生成全新的內容,由此帶來了非常多的創意空間。比如通過一部小說的文字描寫,生成故事畫面、人物形象、環境布景等,可以幫助創作者大大節省時間。

正因如此,多模態大模型需要處理的數據類型多,規模量大,模型參數已經達到千億級別,需要龐大的算力來支撐。得益於全國多地對AI基礎設施的重視和建設,才能夠讓多模態應用達到比較好的效果,進而支撐AIGC創作業態的進一步發展。

AIGC的「含科量」與「含資量」

此外,AI平台化的生態搭建,以及充足廣闊的產業實踐空間。大模型雖好,對於很多企業和創作者來說,想要自己從頭開發一套大模型用來進行AIGC既不經濟、也不現實。這時候,AI平台化、民主化就變得至關重要。

去年推出的許多多模態大模型,如紫東太初、文心、M6等,都通過AI平台進行開源,可以直接調用並通過雲端算力進行訓練。一些科技企業也將數字人技術開源開放,這些動作大大降低了企業和創業者的開發門檻,創作效率提升,進而助力高質量AIGC變得普及。

目前,南京、武漢等地,已經開始形成多模態應用的產業集群。而千行百業的數字化、數字經濟的持續發展,也給予了AIGC前所未有的產業空間與實踐場景。比如此次受資本追捧的一些AIGC公司,就瞄準了「遊戲+AI」場景,通過演算法生成數字人、語言互動等方式,滿足玩家在虛擬世界中個性化、定製化的體驗需求。而更多的產業實踐,也會源源不斷地產生新的數據,推動演算法的迭代升級。

AI產業化和產業AI化的發展,當下已經能夠支持內容創作的大變革,AIGC的流行,自然也就水到渠成了。

三、「含資量」不低,警惕AIGC的虛火

AI創作的大行其道,是科技發展到一定水平后的必然現象。但資本熱捧,許多投融資消息突如其來,卻給「AIGC」一詞添上了一種別樣的味道。

為什麼說是「突然」呢?如前所說,AI寫詩之類的NLG應用並不罕見,但一直沒有被以「AIGC」一詞整合包裝起來。2021年7月,一位股民詢問擁有虛擬數字技術開發業務的絲路視覺:在AIGC技術上是否有儲備或應用?結果被該企業發言人直接反問:啥是AIGC?顯然,當時「AIGC」一詞就連從事相關業務的企業高管都不熟悉。

AIGC的「含科量」與「含資量」

而在某問答平台上,關於「AIGC未來會扮演什麼樣的角色」的問題,只有一個回答,來自某投資機構,而該機構正是某AIGC沙龍的組織方,參與討論的創始人也主要描繪了一種核心的AIGC應用場景,那就是元宇宙。

而剛剛拿下千萬美金融資的某AI公司,正在布局的AIGC領域也聚焦在虛擬人技術,為遊戲行業提供基於AI的智能NPC、自動化QA、對話系統和AI陪玩。完成1億美元融資、由紅杉中國領投的某獨角獸,核心產品則是AI bot,表示希望作為虛擬世界的先鋒,圍繞元宇宙開展多維度的基建。

AIGC的「含科量」與「含資量」

從這些脈絡中不難看出,AIGC技術本身很真實,但長期以來一直處於默默發展、偶爾出圈的狀態。能夠在近期快速成為一個風口、一種網紅概念,與元宇宙的爆火、資本的動向,不無關係。在這個新故事中,一般會有如下邏輯:

  1. 元宇宙需要很多數字人、需要個性化的數字環境;
  2. 這些內容光靠人來開發周期太長,需要更高效的生產方式;
  3. AI的能力就是提質增效,適合用來創作;
  4. 所以,AIGC有前途。

歸根結底就是,元宇宙要火了,AI能做。

AI能做是真,但元宇宙到底啥時候火,可就沒個准數了。

我們此前探討過,作為一個複雜龐大的技術集群概念,元宇宙依賴很多技術的成熟,距離真正成型還很遙遠。在這一天到來之前,沒有人能清楚地定義什麼是元宇宙,自然也不可能量化出到底需要多少虛擬人、數字人。那麼,為了元宇宙而生的AIGC,到底價值幾何,可能就跟元宇宙一樣,是個見仁見智的玄學了。

既然AIGC的走紅是技術發展的產物,那麼它的上限,自然也要受到技術規律的約束。誠然,AI的發展給內容創作帶來了很多可能,但技術也決定了很多內容依然是AI無法做到的:

首先,AIGC的內容質量有待提升。

OpenAI用於編寫內容的通用GPT-3模型發布之後,很多內容機構都基於它開發了相應的創作模型。目前來看,主要應用還是一些重複枯燥工作的自動化,以CCTV的AIGC平台為例,主要是自動完成挖掘新聞熱點,將新聞報道數據進行深度關聯、輔助編輯選題策劃,基於模板快速生成海報圖片圖表,智能生成內容標籤,修復歷史視頻等等。

AIGC的「含科量」與「含資量」

一些用於生成內容的AI編寫器,創作能力實在是不太行。要麼只能用於生成一些符合SEO(搜索引擎優化)的營銷內容,比如YouTube視頻標題、Facebook廣告標題、GoogleAds標題和描述、亞馬遜產品描述等等,主要是更通順地把關鍵詞堆疊在一起,你不會覺得某寶的寶貝標題就是一篇「大作」吧。

要麼是由機器學習黑匣子生成的博客文章。對於這類文章,平台們往往也會提醒,AI無法複製情感,沒有靈魂、同理心、經驗等細微差別。所以也會建議使用AIGC工具的創作者,僱用人類作家來校對這些工具創建的內容。

所以至少目前為止,AIGC能提供很多幫助,但還是無法取代人類創作者的。

這是我用一個海外AI一句話生成器寫出來的文章,可以說是前言不搭后語,大家給它打幾分呢?

AIGC的「含科量」與「含資量」

AIGC的「含科量」與「含資量」

其次,AIGC的交互能力還不夠自然。雖說NLP技術有了極大的進步,人工智慧聊天機器人可以幫助企業與潛在客戶聊天、給轄區居民撥打電話、為電商平台用戶提供售前售後諮詢服務……但想必大家依然還是能夠很明顯地區別出,對面到底是真人還是聊天機器人。反正我本人,如果需要完成一些複雜的交流和操作,都會一開始就輸入「人工客服」「找人工」等命令,而不是跟智能客服在那裡「鬼打牆」。

目前,基於AI技術的人機交互還需要漫長的試錯、實踐、積累、迭代,更適用於一些重複率高、流程標準化、對專業度或靈活響應度沒那麼高的交流。比如在智能音箱里跟主人閑聊,作為虛擬偶像滿足粉絲的基本情感互動需求,或是在電商場景里作為主播「念稿子」直播帶貨。

這裡面其實已經有非常大的想象空間了,雖然距離「元宇宙」中那種「和真實的人一樣」的願景還有距離。

AIGC的「含科量」與「含資量」

從應用前景來看,「含科量」滿滿的AIGC,打開了內容創作的想象力,將會給包括虛擬人、數字人、圖文音影游等各種應用創新帶來可能。在廣闊的產業和個人消費市場,AIGC正等待著展翅高飛。而「含資量」不低的AIGC風口,當元宇宙的熱潮退卻后,又會有多少裸泳的人,就需要時間來告訴我們答案了。

#合作媒體#

腦極體,微信公眾號:腦極體。寫讓你腦洞大開且能看懂的人工智慧、流媒體、海外科技

本文原創發佈於人人都是產品經理。未經許可,禁止轉載

題圖來自Unsplash,基於CC0協議

給作者打賞,鼓勵TA抓緊創作!