以微信為例,聊聊在內容推薦上AI的一些應用實踐 | 人人都是產品經理

編輯導語:AI與產品的融合早已經不是什麼新鮮事,微信作為內容產品服務的一大提供者,自然也離不開內容推薦。而內容推薦與AI的結合,對微信來說是一大機遇和挑戰。本文作者以微信為例,和我們聊一聊在內容推薦上,AI都有哪些應用實踐。

內容推薦一直是流量分發中十分常見的應用方向,如頭條的資訊、抖音的短視頻、網易雲音樂等等。而微信也從去年開始逐漸推出更多內容產品服務,包括視頻號、直播、看一看等等,對於微信而言既是機會也是挑戰。

機會意味微信已經開始探索出屬於自己的內容成長方向,挑戰則是在如何在龐大的流量上,管好內容的質量輸出、推薦服務體驗。

而本文也將基於微信當前的內容產品服務,聊一聊微信將在多個場景服務上,都可能會進行哪些AI能力實踐(值得說明一下的是,本文無意從技術角度探究AI原理,更多從應用場景出發了解當前的實踐情況)。

1. 到底什麼是內容推薦?

在當下娛樂高度消費的社會,每個人幾乎每天都在接觸不同的內容產品服務。尤其是現在推薦演算法越發成熟,對用戶和內容的理解越發深刻。

諸如頭條的資訊、抖音的短視頻或網易雲音樂等等,但這些都是只是用戶能接觸最表層的「事物」,要想提供這樣的服務,背後有著一套成熟的體系。所以在這裡也先簡單科普下,什麼叫內容推薦服務。

以上就是一套典型的內容推薦服務體系,具體可以劃分3部分:基礎服務>內容識別+用戶畫像>推薦引擎。

1.1 基礎服務

所謂基礎服務,即搭建整個系統服務所需的一些基礎能力。基於內容、用戶及推薦引擎環節,這樣的基礎服務需要涉及內容源、工程、數據等方面的能力支撐。

  • 內容源:主要包含內容的引入存儲、處理管理,把眾多非結構化的數據,或者不同形態格式的內容數據,以統一結構化的形式管理,便於為後續內容識別提供統一的方案;
  • 工程:對於這樣的能力,需要工程端給予性能優、高可用的研發能力支撐,對服務的計算效能、演算法模型的推理服務等都需要較強的支撐;
  • 數據:在整套服務中,數據是不可或缺的,對於內容的數據、用戶的數據等等,都構築了以「用戶」維度的畫像特徵,本質上推薦服務把合適的內容分發給合適的用戶,那麼從數據維度識別用戶,就必不可少,而關鍵的數據就包含用戶信息數據(頭像、昵稱、身份信息等)、行為數據(如當前位置、操作偏好等等)。

1.2 內容識別

這是本文的重點探討內容,在推薦服務中,我們要把「內容」這一具體物品給到用戶手上,在此前提上是要對內容進行恰當的理解識別,來支撐更好的推薦。

而這道工序就涉及內容安全、內容質量及內容體驗等關鍵應用場景,而這部分就涉及大量AI能力的輸出。下文也將重點探索微信是如何在這一環節進行AI能力實踐,這裡也簡單介紹幾個關鍵的演算法技術方向:

  • NLP:Natural Language Processing,即自然語言處理,通俗來講就是研究計算機如何理解人類語言並能進行相關的意圖思考。而時下文本識別、關鍵詞抽取等能力輸出,主要就是立足於這一技術;
  • CV:Computer Vision,即計算機視覺,任何關於圖片、視頻等形式,都主要應用這一技術能力;
  • ASR:Automatic Speech Recognition,即自動語言識別技術,是一種將人的語音轉換為文本的技術,例如把視頻中的音頻轉譯為文本,從而通過文本識別方式進行處理。而這一技術難度主要在於環境干擾程度、語言種類及辭彙表豐富性等等。

1.3 用戶畫像

前面也提到,對內容識別的同時,也需要對「用戶」進行刻畫識別,只有對兩方面都進行充分識別,那麼推薦引擎側才能進行更好的分發。

而用戶畫像本質上也是對用戶打標籤,至於需要打什麼標籤,就依賴推薦策略的制定,但基本的身份信息、生理特徵、興趣偏好等等都是需要具備的。

1.4 推薦引擎

一個推薦模型的部署,依賴標籤數據、推薦策略等形式的組合,其中標籤數據即來源於對內容、對用戶的識別數據,而推薦策略則基於業務目標等方式制定,比如基於內容排序推薦、基於協同過濾排序推薦、基於用戶行為偏好等等。

以上就是一套完整的內容推薦服務,其中本文重點探討的就是「內容識別」這一環節。

2. 微信的內容產品矩陣

此前微信的內容產品更多的是提供多入口的流量曝光,而在推出視頻號和直播之後,都開始嘗試以「推薦」為形式的內容分發。

而這樣的推薦,已經不僅僅是社交好友間的推薦,更多需要「平台」去介入。但是由於推出了較多內容產品,不同的內容服務其內容源是不一樣的,這就意味著微信需要更多去理解它們當前的「內容畫像」。

從上圖可以看出,搭建目前已有的內容產品服務涉及3個關鍵環節:

2.1 基礎平台

搭建這樣的內容生態服務,少不了底層服務支撐相應的「內容消費品」,像微信公眾號提供內容推文,微信廣告管理廣告素材的上傳、審核及投放,又或者微信應用本身可以發布相應的長短視頻、社交信息(文本、圖片、視頻、語音等)。

2.2 內容信息

通過基礎平台所提供的能力,支撐了當前大家所熟知的各類內容形態的生產。如文本方面,社交聊天的文字信息、廣告素材的標題文案、公眾號的推文等等。

而這些將積累成為微信一大價值資源,即原創內容源,而微信也可以藉助巨大的流量再結合這些內容資源,打造相應的內容服務。

2.3 內容產品

對於大眾用戶而言,最終能夠接觸和消費體驗的內容服務,就是應用表層。而微信在相繼推出完視頻號和直播后,已經基本形成內容產品的應用雛形。

即推薦、廣告及搜索於一體的內容產品服務,如推薦中的公眾號推文、視頻號、直播等等,廣告中的朋友圈廣告、公眾號廣告。基本上已經延伸了大眾用戶日常場景中所能觸達的地方。

3. 一些常見的演算法評估指標

為方便理解,這裡也簡單介紹下AI演算法能力的常見評估指標:準確率、精確率、召回率、漏報率、誤報率。

以微信為例,聊聊在內容推薦上AI的一些應用實踐

假設當前有100個視頻樣本集(已去重),其中是電影類視頻(正樣本)的為70個,非電影類視頻(負樣本)的為30個。而針對這一批樣本集,演算法識別為電影類的視頻為80個,非電影類20個。

其中人工驗證發現演算法識別為電影類80個中實際正確為65個(正樣例),剩下15個實際為非電影類(負樣例)。識別為非電影類20個中實際正確為15個(負樣例),剩下5個為電影類樣本(正樣例)。

3.1 準確率

即演算法準確識別正樣本為正樣例和負樣本為負樣例的總個數,在所有樣本的佔比,公式為:

準確率=(演算法預測正確的正負樣本內容/所有樣本內容)*100%

假設演算法識別100個視頻中為電影類視頻有80個,其中65個是正確的電影類內容(正樣例),剩餘20個非電影類視頻中15個正確的非電影類內容(負樣例),則為:(65+15)/100*100%=80.00%。

3.2 精確率

即演算法正確識別正樣本為正樣例的對象,在所有識別對象(包含負樣例錯誤認為正樣例)的佔比,公式為:

精確率=(演算法預測正確的內容/演算法預測的所有內容)*100%

假設演算法識別100個視頻中為電影類視頻有80個,其中在數據驗證中發現80個裡面有65個是正確的,則為:65/80*100%=81.25%。

3.3 召回率

即演算法正確識別正樣本為正樣例的對象,在所有內容池中實際正樣本的佔比,公式為:

召回率=(演算法預測正確的內容/所有正確的內容)*100%

假設演算法識別100個視頻中為電影類視頻有80個,其中在數據驗證中發現80個裡面有65個是正確的,而100個視頻中真正為電影類的70個,則為:65/70*100%=92.85%。

3.4 漏報率

即演算法識別為正樣例但實際為負樣例的對象,在所有內容池中正樣本的佔比,公式為:

漏殺率=(演算法預測錯誤的正確內容數/所有實際的正確內容數)*100%

假設演算法識別100個視頻中為電影類視頻有80個,即認為剩下20個為非電影類,而在數據驗證下發現20個中有5個實際是正確的(即演算法未識別到),則為:5/70*100%=7.14%。

3.5 錯報率

即演算法識別為負樣例但實際為正樣例的對象,在所有內容池中負樣本的佔比,公式為:

錯報率=(演算法預測正確的錯誤內容數/所有實際的錯誤內容數)*100%

假設演算法識別100個視頻中為電影類視頻有80個,其中在數據驗證中發現80個裡面有15個實際是錯誤的,而100個視頻中實際為非電影類的有30個,則為:15/30*100%=50.00%。

以上就是演算法常規的效果驗證指標,而通常精確率、召回越高即代表效果越好。

但是不同的業務場景不同,標準是不一樣的,有些可能要求高精確低召回,也可能是高精確高召回,所以指標效果基準看業務需求而定。但整體重要性依次為:準確率>精確率>召回率。

4. 內容推薦上的一些AI實踐

大家所接觸被」推薦「的內容,其實是被加工處理過,是一個近乎合適正確的內容給到用戶手上。但是要做到這個地步,就需要不少的「潛在」工作。在內容推薦服務中,其實還具備「內容安全」、「內容質量」和「內容體驗」等3個環節的場景需求。

而在斯洛五層次需求里,對應的便是「生理安全需求」及「尊重需求」。那麼接下來,將進一步研究在這3個環節上,微信是如何發揮AI技術能力的價值輸出。

4.1 內容安全

以微信為例,聊聊在內容推薦上AI的一些應用實踐

上圖是微信公眾號平台官方規範,包含了諸多方面。實際上內容安全是內容推薦中的第一步,也是最基礎的一步。

而這裡的安全指所推薦的內容服務符合國家、行業、平台及用戶自身等權利義務和法律法規要求的規則。廣義上包括了平台內外的「合規安全」,平台外指國家規定、行業法律等,平台內則指平台規則、權利義務等。

具體來說:

  • 平台外:國家層面是否涉恐、涉政、黃賭毒等,行業層面是否侵犯版權(原創聲明)、是否冒認等;
  • 平台內:基於平台的產品服務和特性,進行平台產品的使用規範,如禁止辱罵、廣告、低俗、灌水等。

針對以上的敏感內容,作為一個內容平台是要對其進行安全審核。這裡的審核通常是機器審核和人工審核并行,而AI就是做的機器審核。

4.1.1 場景價值

安全是產品是否能持久發展的生命線,如果一旦觸碰底線,對網路公共環境、文化傳播都有較大的負面影響。一旦平台出現觸碰底線的內容,輕則舉報投訴或下線整改,重則可能直接被關停。

大家可以留意為什麼會經常有」談話「,以及為什麼時不時會有些「產品」被點名並要求各應用商店下架,其中一部分原因就是產品服務在傳播有損公共利益,造成不良影響的內容。所以不管是哪家公司產品,這都是需要十分關注的。

4.1.2 能力輸出

當前行業內,對內容安全審核這一環都有各自成熟的產品能力輸出。譬如百度、騰訊、阿里和網易(易盾)等。通常對於這塊的AI能力輸出,對於微信而言,存在以下的應用實踐:

4.1.2.1 能力類型

以微信為例,聊聊在內容推薦上AI的一些應用實踐

由於微信的內容形式較多,但有些是單一的內容形態,如純文本的聊天信息、朋友圈動態等等。但也有多形態集合的內容服務,譬如公眾號推文、視頻號的視頻內容等等。

不同的形態,所採用的AI能力也是有差異的(在演算法規則上):

  • 單一內容服務:單一的內容形式,只要做採用直接對應的AI演算法能力即可。比如文字則依據NLP能力進行文本檢測審核,圖片則用CV中的圖片檢測審核。
  • 多內容服務:多個形態集合的內容服務,舉個例子像公眾號推文就涉及標題文本(30個字元內)、圖片、視頻、摘要、正文(字元不限)。由於這裡涉及較多形態,這裡的演算法能力輸出會更為複雜。

a. 文本檢測審核

主要採用NLP方向的演算法能力,針對文本進行安全規則審核。

而這些規則d主要結合國家法律法規、平台規範等方面而開發相應的演算法模型。譬如可以識別辱罵、廣告、涉政等內容。而這裡的文本檢測除了考驗詞庫數據豐富性,還有考驗不同語言的複雜性。

b. 圖像檢測審核

主要採用CV方向的演算法能力,這裡的圖像檢測包含純圖片及視頻內容的審核,實際上視頻是由多張圖片(即一幀幀)組合而成,所以本質上兩者都歸屬在圖像檢測審核。

但是由於視頻較長,基於技術限制不可能把每一幀都進行檢測,通常會基於一定策略(隨機、按比例抽取等)進行截幀檢測。同時圖像的檢測會混合多種技術進行支撐,譬如OCR檢測識別文本內容、NER實體識別具體內容(如人物、商品)。

c. 語音檢測審核

語音檢測從另外一種方式,就是把語音轉譯成文本,既而採用文本的方式進行檢測審核。所以可以把其當作另一種文本檢測方式,但這裡關鍵在於保證語音變成文本后的準確性。

  • 難點1:多個形態及形態不一的演算法能力檢測,對演算法的技術指標有更高要求。比如標題文本字元有限,檢測對象的難度較低,但推文的正文卻是字元數不確定,詞句之間也有更複雜的語言變化,那麼同樣做文本審核就更為困難;
  • 難點2:多內容之間存在語義關聯(即多模態分析)。再譬如視頻號的視頻從標題、封面、摘要都沒有問題,都含有某一政治人物,但是在視頻中出現了一個文字特效,這個文本內容同樣表達辱罵性質的,那麼這樣關聯起來也是有問題的。

4.1.2.2 審核範圍

大體而言,兩種主要的審核類型,以上為其支持檢測範圍內。那麼基於這些情況,微信會基於不同的產品服務進行相應的安全檢測。直觀地看,其實可以從下圖可以看出。

  • 圖中左側的2張圖,是典型的文本檢測審核案例,從這裡可以看出這是不同文本做出了是否正常及問題點的安全檢測;
  • 圖中右側的2張圖,尤其是「已停止訪問該網頁」圖,這是大家常見微信的一種的異常處理方式,顯然這是一個垃圾廣告營銷性質的推文而被封禁。而最後一張圖則是正常的一篇推文,對標題、視頻中的文本、水印等其實也會進行相關檢測,完成安全審核。

4.1.2.3 小結

大家日常在微信所能看到的內容,其實是做了一定內容安全而審核過濾的。

但是通常平台不會百分比交給AI來實現,因為有些識別存在邊界模糊的情況,而這些內容本身存在極高敏感性。所以通常在內容安全場景,都會進行「機審「和」人審「的結合,最大程度保證安全。

所以在安全審核場景下所涉及的AI演算法,諸如文本圖片的高敏、低俗等,會相對關注「漏報率」和「誤報率」,簡單來說,對於平台而言審核錯了,重新開放即可。

但是一旦安全審核漏了,最終呈現給用戶,如果內容惡劣程度十分之高,那麼將會造成極大的負面影響。所以這兩個指標也是該場景的各類演算法尤其關注。

4.2 內容質量

內容質量是內容推薦過程中是否高優推薦的一個標準。而所謂內容質量,除了內容合規、社交好友推薦以外,單看這一內容本身是否為原創、篇幅(視頻時長)長度、內容結構是否清晰簡潔(標題黨、圖文不符)、視頻圖片是否清晰等等。

但由於這一類型內容本身有著複雜的語義關係,如果要通過AI完全判斷是否高質量其實是很難的,因為本身沒有一個常規的標準。但是一些基礎的判斷是可以做到的,譬如圖片質量、文章質量等等。

4.2.1 場景價值

對於很多內容創作者而言,可能也都清楚當內容的「質量」達到一定水平,一般官方平台都會加大推薦力度。

因為假如內容作品質量欠佳,過多推薦一是影響平台的調性,二是消耗用戶的興趣度,長期以往只會造成更大的損失的。因為好的內容,才能真正挽留及打動用戶。

4.2.2 能力輸出

從上圖可以看出,左1顯示微信直播遊戲垂類下,動物封面和品類風格推薦不一致的情況。而右側的2張圖,則是高清晰和模糊畫質視頻的對比。而這些都是內容推薦上,常遇到的質量問題。

那麼針對在質量檢測上,同樣有諸多場景將可以值得探索。而在微信內,主要可以有2大維度「內容結構、素材質量」進行實踐。

4.2.1.1 內容結構

常見包括標題黨、圖文不符(即文中插圖、封面插圖與內容無關)、聲畫不符(即視頻內容和音頻內容不一致)等場景。

4.2.1.2 素材質量

包括清晰度(圖片、視頻等)、音頻質量(如卡頓、無聲、噪音等)、聲畫不同步(如延遲)等場景。

  • 清晰度:有時候視頻或者圖片的清晰度,會影響用戶感官感受。清晰度的識別也是當前內容分發中常見的應用場景。而這一能力主要能夠識別當前圖片或圖像是正常或是模糊等鑒別,那麼這裡就依賴多個技術集合,如人臉檢測(人物主體是否清晰)、解析度識別(圖片截幀識別解析度或像素)、OCR等等;
  • 音頻質量:如果是視頻內容或者是音樂內容,那麼就需要注意當前分發的音頻是否出現卡頓、無聲或噪音等等,如果能從AI上進行這樣的支撐,則能在分發時就規避這些低質量內容;
  • 聲畫不同步:實際這也是存在的場景之一,即視頻在播放過程中,音頻會出現延遲或提早,與視頻當前播放內容出現不一致,其實這樣也會影響體驗效果。

4.2.1.3 技術支撐

針對以上的場景,輸出相應的AI能力前提也是需要依賴更多的技術手段作為支撐。

其中有幾個有些比較抽象,無法理解。那麼這裡舉個例子,來介紹一下。假設需要判斷圖中中間的視頻內容,確實與主題內容相關,需要分別進行哪些能力支撐。

  • OCR檢測:因為是視頻,需要通過OCR來識別其中的文本,如彈幕、水印等,來收集數據;
  • 關鍵詞抽取:通過OCR識別的文本,視頻本身的標題等,進行一系列的「關鍵詞」抽取,可以識別出諸如「電影」、「海報”、「愛樂之城」、「高司令」等關鍵詞。但是這些關鍵詞都是獨立個體數據,沒有關係,那麼接下來就需要知識圖譜及NER來進行進一步的「聯結」;
  • 知識圖譜:結合NER實體識別以及上述的關鍵詞,基於知識圖譜關係來梳理出「電影-愛樂之城-男主角高司令」等這一系列有序的數據;

內容分類:實質為分類標籤,即對內容打標進行各級分類,從以上的數據可以看出它是屬於電影類(一級分類)-歐美電影(二級分類)這樣的關係。分類的全面性及細粒度體驗當前平台的分類標籤能力。如果平台足夠儲備這樣的分類數據,結合以上的數據,就可以快速識別該內容是一致的,可以進行推薦池基於推薦規則進行分發。

4.3 內容體驗

在做了內容安全、內容質量的環節后,內容在推薦過程中已經得到了一定的分發。但是此前都是針對單一內容作品進行AI能力支撐,而在推薦過程中,以及多內容分發時,遇到的又是另一重問題。

而內容體驗指的是內容在推薦過程中,所給用戶帶來的體驗感受。基於這樣服務場景,AI同樣可以進行一些能力輸出探索。

4.3.1 場景價值

大家在體驗信息流推薦時,譬如抖音或者當前微信視頻號的推薦頻道,大多基於用戶偏好、行為偏好等方面進行策略推薦,這樣就有一系列體驗問題:

  • 假設作為消費型用戶,我喜歡體育及科比球星,那麼是否推薦都給我推薦科比的視頻?
  • 假設作為內容生產型用戶,大家都創作了科比的視頻,你一個我一個都這樣推薦給用戶,看著對內容生產者有利益,但對於普通用戶而言是否就有幫助?
  • 假設作為內容生產型用戶,我手上有幾個視頻號自媒體矩陣(以及都有較高的粉絲量),但是這幾個賬號裡面有些作品內容是幾乎重複的。那麼作為平台方,該如何規避這些不同賬號但旗下內容重複的分發?
  • 假設有一個地域性的新聞視頻,所報道的內容是跟深圳本地強相關的,但是在沒有做分類及位置信息的前提下,怎麼最大化地把這個內容合適推薦給本地信息流裡面去?
  • 單看某一條內容從安全、質量兩個層面來看都是ok的,但是僅僅考慮這兩點是完全不夠的,關注用戶在內容推薦中的體驗情況,並持續優化,最終反哺平台發展(譬如因為體驗更好增加停留時長、互動次數頻繁等等)。

4.3.2 能力輸出

在已經完成了安全和質量檢測后,內容已經具備一定的可觀賞性。

那麼想要進一步改善用戶體驗,主要在於推薦的內容是否準確和契合用戶喜好,而這部分更多是推薦策略的工作。那麼剩下的就是使用體驗上儘可能得到提升。那麼在此環節,演算法所能服務的應用場景主要涉及3個方向。

4.3.1.1 內容重複

這類問題場景,是時下內容推薦業務最常見的問題。

一個原因在於創作者本身是多媒體矩陣,可能不同的賬號會進行同內容的發布。其二是內容平台本身也會從第三方平台引入內容,本身內容的來源歸屬就不可控,所以也不可避免引入的內容會和其他第三方平台內容存在重複。

包括短視頻推薦、新聞資訊推薦、直播推薦等等,大家可能在日常中都會偶然刷到重複內容,這裡重複的情況主要分為2種:

  1. 純內容重複:即內容完全或接近一致。這種可能存在同一賬戶下多條內容重合,或不同賬戶下同一條相似內容重合。從上圖中的左側1、2可以看出,這是同一時段內(23點34-35分間),同一條相似內容在不同的賬戶下發生重複現象。明顯微信在這方面其實還沒做到精細化的管理,但是AI能力上,其實是可以進行「重複」判斷及置信度的反饋,獲取這樣的演算法標籤時,在內容推薦分發上就可以一定程度上規避這樣的情況。即假設用戶已在頭一條成功曝光和觀看內容,則在相似的下一條基於已有重複標籤,在去重時間窗口內(如3個月內)進行過濾分發。
  2. 主題性重複:即在內容推薦過程中,主題分類或話題性十分相似。譬如前面提到科比視頻,如果在視頻推薦中前10條中7條都是科比的(儘管具體內容不同),但是基於偏好不能直接分發給用戶,因為這樣看似迎合了用戶喜好,但實際反而造成用戶觀賞疲勞,相似性內容太多缺乏好奇性和新鮮性,最終影響對平台的感官感受。這裡的支撐,依賴於主題分類的規則制定。

4.3.1.2 內容分類

垂直分類是內容推薦的一個重要支撐點,因為用戶本身有對某些特定的領域會有強偏好表現,那麼在推薦上就要有所側重。但是用戶主動選擇主題分類發布本身是一個不確定性行為,甚至有些還選不正確(有邊界模糊)。

所以這時候AI演算法就可以協同進行「分類打標」,但是技術側能把海量的視頻進行準確分類打標,也是行業常見的一個困難點。

並且分類不僅僅是一級分類,還要儘可能做到更細粒度的分類,即多級分類,如電影、電影_紀錄片、電影_紀錄片_人物傳記。分類是否科學、標籤是否準確,都極具考驗。

舉個例子,仍舊以科比視頻而言:左側為科技的紀錄片視頻,右側是關於科比體育比賽視頻,本身都帶有體育、科比、競技性質內容,但兩者卻屬於不同的視頻類別,這對AI而言,需要建立全面和準確的分類標籤體系,這就需要大量的AI技術做支撐。

4.3.1.3 地域識別

基於地理位置增加內容分發曝光的機率,是當前各大內容產品基本都會採用手段。從微信的視頻發布及直播中支持「添加位置」以及同城視頻分發的功能,就可見其重要性。

那麼假如當前內容沒有標記地理位置信息,又該如何去識別內容對應的地域屬性?不同的內容形態,採用不同的方式。

像圖文資訊(類似公眾號推文),則可從文本中切割關鍵詞進行地域信息提取,以及加工處理組合成結構化的地域屬性。而視頻內容也是類似,只是因為圖片演算法檢測,需先通過OCR識別或各類物品識別提取文本數據,繼而進行相應的地域屬性識別。

5. 總結

以上就是結合當前內容推薦業務和微信的內容生態狀況,作出了AI所能應用實踐的探索研究。但文中提及的應用實踐也許只是冰山一角,畢竟整個生態服務十分之龐大,能夠做到各類的精細化服務是長期的工作。

此外,關於微信在這方面的內容推薦實踐上,未來仍舊還有不少工作需要落地:

  1. 微信的內容推薦業務還處於起步階段,尤其是視頻推薦,未來的質量和效果體驗將會有較大的提升,而AI在其中的實踐也將有較大的空間進行發揮;
  2. 整體而言,微信已經搭建了基本的內容推薦服務產品體系,但是在功能完備上,當前還是比較克制。尤其是新推出的視頻號、直播,對比同類型競品,所能實現的能力還是偏少。但個人認為微信更多在探索屬於自己特性的內容發展方向,無意成為另一個常規的推薦系統、直播系統;
  3. 當前微信的內容推薦業務更多的只是發揮流量分發作用,即引入外部內容源到微信生態中進行消費,實際還缺少了標準統一的「內容生產」環節。一個內容產品服務除了推薦側做得足夠好,在內容源也是至關重要,所以在構建自身的內容庫方面,微信還有很長的路要走;
  4. 內容本質上依賴創作者的輸出,即PGC和UGC的共生,但是基於內容賬戶體系的建立,尚未形成集合賬號、內容於一體的賬戶等級服務體系。同時「原創」作品在一個平台的價值是十分大的,參考當前各大內容廠商,都在推出創作者計劃並扶持各自優質的內容創作者。

最後,如果大家想要對AI技術有進一步的了解,不妨多關注騰訊雲、阿里雲、百度大腦及網易等多個平台,在人工智慧領域的一些技術探索。

#專欄作家#

A.D,公眾號:吾某,人人都是產品經理專欄作家。大數據分析產品經理,專註數據挖掘工作。

本文原創發佈於人人都是產品經理,未經作者許可,禁止轉載。

題圖來自圖蟲

給作者打賞,鼓勵TA抓緊創作!