AI續寫小說悄然流行：人類特有的創作力，已經被AI複製？

編輯導語：AI人工智慧的發展逐漸讓人們對未來有了更多元化的想象，尤其當AI進入極富創意化的領域時，AI是否能帶給人們不同於以往的內容？本篇文章里，作者就AI創作對內容創作領域產生的影響進行了分析，一起來看一下。

林黛玉葬花之時曹雪芹亂入，並與寶玉、襲人發生一場持續千年的世紀大戰；鴻門宴再現，項羽喊著「偉大與光輝」與樊噲打作一團、而後項莊趁亂刺死劉邦；孔融讓梨引發一場長達十多年的報復和最終精心謀划的血案；《桃花源記》中善良淳樸的村民竟會為了保守桃花源的秘密而設計害死漁民……

這些熟悉而又陌生的內容，並不是網友們對經典文學作品的惡搞，而是來自於AI的故事續寫。

今年以來，由AI續寫故事作為文本的視頻在B站悄然流行開來，一些UP主利用市面上的AI創作應用續寫人們熟知的文學作品，再將新的作品以人聲演繹，配上BGM后製成視頻。

經過AI的一頓操作，名著成了爆款爽文，前有諸葛亮開戰鬥機，後有莊子研究「三體」，各種平行世界信手拈來，AI一本正經胡說八道的本事，比過去的地攤文學還強。

其實，對於相關工具的使用者而言，用AI進行創作並沒有技術門檻：只需輸入文學作品的某些片段，AI創作機器就會根據給定文字的內容與風格對故事進行續寫，這些經過AI二次創作的故事，往往情節曲折離奇，與原作的走向大相徑庭，這種內容因為反常規和新鮮感而受到一些網民的追捧。

不過話說回來，藝術創作這種高度創意化、個性化的工作，原本被視為「人類的最後一片凈土」，是理論上最不可能被人工智慧取代的工作之一，可如今人工智慧技術的發展卻為藝術創作開闢了一條新的捷徑。本期全媒派（ID: quanmeipai）帶來一篇文章，探析AI創作正在對內容創作領域產生怎樣的影響。

一、AI寫作是怎麼回事？

AI創作也就是機器人寫作，這是一種擬人化的說法，實質上是指通過一定的計算機程序，對輸入的信息進行自動化的分析、處理和加工，從而生成一篇較為完整的文章。總的來說，今天流行的AI續寫，其實已經算是比較成熟的能力。

隨著人工智慧技術的快速發展，自然語言生成（natural language generation, NLG）技術在世界範圍內得到廣泛的應用。《紐約時報》和美聯社等新聞機構都曾採用NLG技術來撰寫新聞報道；僅在2014年，技術公司Automated Insights就實現了以每秒超過2000篇的速度生成新聞報道，全年發布新聞共計10億多篇。[1]

AI寫作背後的原理非常複雜，其核心是自然語言處理（natural language processing, NLP）技術，同時涉及到數據挖掘、機器學習、知識圖譜等多項人工智慧技術。自然語言處理是指讓機器擁有理解並解釋人類語言的能力，目標是讓機器在理解語言上像人類一樣智能，最終彌補人類交流（自然語言）和計算機理解（機器語言）之間的差距。[2]

自然語言處理（NLP）涉及兩個流程，分別是自然語言理解（natural language understanding，NLU）和自然語言生成（NLG）。市面上的寫稿機器人大都是NLG系統，目前主要有模板式、抽取式和生成式這三種技術方向。[3]

模板式寫稿機器人主要通過優化演算法，在預先存儲的大量寫作模板中，選擇與給定材料相匹配的模板，將信息加以組合生成文本，是目前應用最成熟、實現最容易的一種機器寫作方法。

抽取式機器人會對文本進行語義分析，識別冗餘信息，抽取重要內容，通過摘錄或概括的方法壓縮文本，形成對於既定文字的摘要，再加以計算確保文摘的連續性，這種技術廣泛應用於新聞內容概括和文摘生成。

生成式NLG主要通過深度學習和增強學習技術實現，機器通過大量的文學作品樣本進行訓練，學習各類寫作風格、建立寫作模型，再根據輸入的文字片段獲知任務需求，預測並生成與需求相匹配的文稿，進行輸出。

從現階段來看，模板式和抽取式寫稿機器人的技術已經趨於成熟，在市場上得到了廣泛的應用；生成式NLG技術更加智能，也是當前NLG技術中更為高級的目標，OpenAI等研究機構在這方面做出了嘗試，並在市場上得到了應用。

二、我們身邊的AI寫稿工具人

AI寫作在當今社會早已不是什麼新鮮事，早在2011年，《洛杉磯時報》就開始研發麵向地震領域的自動化新聞生成機器人Quakebot。2013年3月，Quakebot因率先報道南加州發生的4.4級地震引發關註：2014年3月，美國洛杉磯發生4.4級地震，Quakebot用時3分鐘就完成了相關報道的寫作和發布。

同年7月，美聯社引進Automated Insights公司開發的新聞寫作機器人，開始使用自動生成新聞技術。此後，《紐約時報》《華盛頓郵報》《衛報》和路透社等媒體都走上了自動化新聞發展的道路。[4]

Quakebot近期發布的新聞。圖片來源：《洛杉磯時報》

國內在自動化新聞領域也有許多嘗試：2016年5月，四川綿陽發生4.3級地震，中國地震台網研發的地震信息播報機器人用6秒寫下560字的速報，報道內容翔實；2017年8月，該機器人在第一時間報道了四川阿壩州九寨溝縣的7.0級地震，引發廣泛的討論和關注。

這條新聞消息約540字，新聞涵蓋了速報參數、震中地形、熱力人口、周邊村鎮、周邊縣區、歷史地震、震中簡介、震中天氣8個方面的內容，並配有5張配圖，用時僅25秒。在此後的餘震報道中，新聞機器人最快出稿速度僅有5秒。[5]

地震信息播報機器人對九寨溝地震的報道

除了新聞報道以外，AI寫作也在其他文字創作場景得到了廣泛的應用。目前，無需人工干預的機器人寫作可以生成詩歌、廣告、各類行業分析報告、歌詞、小說、甚至劇本。

以詩歌為例，微軟研發的機器人小冰於2017年出版了詩集《陽光失了玻璃窗》，這是歷史上第一部人工智慧詩集，其中包含139首現代詩。[6]

諸如「快把光明的燈擎起來了/那裡有美麗的天/問著村裡的水流的聲音/我的愛人在哪/因為我的紅燈是這樣的幻變/像是美麗的秘密/她是一個小孩子的歌唱/那時間的距離」的華麗辭藻還頗具美感，只是在邏輯性上有所欠缺。除了現代詩，律詩、藏頭詩、詞等各種風格的詩歌創作軟體已然在市場上層出不窮。

相比於新聞，故事、小說等連續語義的創作會更加困難，而這些也早已不是難題。早在2016年的倫敦科幻電影節上，紐約大學研究人員開發的機器人Benjamin創作了一部長達9分鐘的科幻電影Sunspring，贏得了大批關注；MIT媒體實驗室開發的機器人Shelly專職撰寫恐怖故事，並在Twitter更新；Botnik研究室採用預測的演算法創作了《哈利波特》的續集。

三、除了寫稿，AI創作還有其他形式

當AI創作技術應用於寫稿，可以誕生機器版的記者、小說家、詩人、編劇等，而當它應用於繪畫、音樂和舞蹈領域時，則可以「培養」出畫家、作曲家和編舞人員。

1. AI繪畫創作大放異彩

利用機器繪畫早已寫入了人類的夢想清單：早在18世紀70年代，瑞士已經有人利用機械臂繪畫；2016年，谷歌研發的繪畫AI在舊金山拍賣會上大放異彩，其作品一度拍出單幅8000美元的高價；2019年，微軟小冰獨立完成的原創繪畫作品在中央美術學院美術館展出，並於2020年推出個人繪畫作品集。[7]

2. AI音樂創作譜寫別樣樂章

AI在音樂創作中的應用比比皆是：2016年，索尼公司計算機科學實驗室CSL的DeepBach項目仿照巴赫的風格創作的合唱曲目，被專業音樂家誤認為是巴赫的作品。

除了譜曲，AI 還可以創作可以唱出聲音的歌曲，CSL實驗室的機器人Flow Machine模仿披頭士的風格，自主創作了歌曲Daddy』s car。法國計算機科學家Pierre Barreau創造的作曲AI應用Aiva可以根據需求創作不同風格的音樂，甚至可以根據圖畫作曲，Aiva也於2017年成為「法國及盧森堡作曲家協會」（SACEM）的首個非人類會員。

3. AI舞蹈創作演繹非凡舞曲

有不少團隊開發了舞蹈創作類的AI：谷歌研究院建立了名為AIST++的3D舞蹈動作數據集，據此訓練的AI能夠根據給定的音樂和一段2秒左右的種子動作生成長序列的逼真的3D動作。

目前已有的舞蹈創作AI基本都能根據目標音樂生成與之匹配的舞蹈動作，並通過3D建模的方式將舞蹈進行表演。經過模型構建方法的迭代升級，AI生成的3D舞蹈在動作質量、動作多樣性和動作與音樂的相關性方面均有著還不錯的表現。

AIST++舞蹈數據集的示例。圖片來源：https://arxiv.org/pdf/2101.08779.pdf

OpenAI公司最新推出的GPT-3模型，則開放了API服務，申請者可以調用GPT-3的API，將其進一步開發為論文翻譯工具，網頁生成工具，前端設計器，聊天機器人甚至遊戲開發工具。在GPT-3的身上，我們看到AI從某一個領域的創作者成為各方面兼修全才的可能性。[8]

四、AI作為內容生產者還有哪些缺陷？

AI創作固然強大，但要想做到大規模的普及和落地，尚有一些問題橫亘於我們面前。

首先就是AI的價值判斷問題。機器學習只是提取訓練集數據的風格特徵，並對這種加以模仿，機器看似具有「學習」功能，實質上仍落入了按圖索驥的窠臼。

AI本身對文本創作並沒有價值判斷，所以在AI生成的故事當中，我們可以讀到諷齊王納諫的鄒忌為了保住權勢富貴而出賣小妾，讀到為孩子買橘子的父親在月台摔倒暴斃……這些離奇的情節不僅與邏輯不符，對正常的價值導向也難以判定。如果訓練內容存在問題，或者某些用戶輸入時刻意引導，AI生成的內容在倫理道德方面的處境更會雪上加霜。

其次是AI創作的版權問題。在當前技術框架下，AI的訓練效果在很大程度上取決於語料庫，沒有足夠量的語料庫，AI便無法進行學習，更無法進行創作。

那麼AI產出的作品該歸語料的作者還是歸AI的創作者所有呢？如果歸語料作者所有，那麼又如何為龐大的網路語料資源劃定作者呢？如果歸創作者所有，又能否將使用了相同技術線路和演算法的創作者視為抄襲？這些問題仍然需要法理和倫理上的探討。

最後便是AI使用者的問題。

AI為內容創作提供了一種更加輕鬆、便利的可能性，但在一些別有用心的人眼中，AI成為了助長抄襲的洗稿工具：輸入一段語句，AI就會對語言結構進行重組，對關鍵詞加以替換，從而在短時間內複製網路爆文……技術雖為中立，但不良的使用意圖讓技術成為了幫凶。

自AI誕生之日起，有關於AI取代人工的憂慮便不絕於耳。顯然，由AI續寫的故事雖然有點扯，但終究還是能滿足一部分人的內容消費需求，甚至有走紅的潛質。至於智能機器與內容創作者的關係，終歸還是會走向人機協作、共生共進，而不是相互取代、零和博弈。

參考鏈接：

[1]https://www.sciencedirect.com/science/article/pii/S074756321930398X

[2][3]https://www.sohu.com/a/194437537_644338

[4][5]https://baike.baidu.com/tashuo/browse/content?id=121b5b2a75f6065bb9eeb3e4

[6] https://www.yubaibai.com.cn/article/5610496.html

[7] https://blog.csdn.net/qq_41731283/article/details/108825436

[8] https://new.qq.com/omn/20200724/20200724A07WET00.html

作者：李秀；公眾號：全媒派（ID：quanmeipai）