乾貨篇:AI賦能醫藥工業發展案例 | 人人都是產品經理

編輯導語:醫藥工業往往研發周期長、成功率低並且研發費用高,這也是一直是困擾製藥企業的魔咒。而AI技術日新月異的發展給很多行業帶來了變革,醫藥工業同樣也受益於AI帶來的技術紅利,解決行業痛點,提高開發效率。本篇文章中,作者就為我們介紹了AI賦能醫藥工業發展的案例。

剛剛過去的這個周末,我受到邀請進行了一次演講,演講題目是《AI賦能醫藥工業發展案例》。

這次演講中,我將我們之前所做過的2個案例給大家做了詳細的講解,出乎意料的是對醫藥方面感興趣的聽眾遠遠高於我的預期。

從產業互聯網的角度來考慮,未來是B端產品的市場,也是傳統企業轉型信息化的重要時刻。我們需要結合未來的發展對以後的產品布局進行深入的分析,做好頂層架構,才能擁抱以後的產品格局的變化。

我是醫藥行業的產品經理,所以在這次演講中主要針對於醫藥工業方向進行了主要論述。其中包含醫藥工業語言的定義及符號OCR技術,知識圖譜在醫藥工業以及藥物情報領域的應用等。

對於醫藥工業還有很多工作可以去做,在我的演講中也進行了梳理,從早期藥物發現、上游工藝、下游工藝、生產質控等多個方面,還有待於我們去探索。

我在這裡給大家詳解一下我演講的主要內容。

頭像和介紹就不細說了,目前為止沒有出現脫髮的相關癥狀。

工業互聯網的核心在於數據採集、數據連接、數據計算與處理,俗稱端、管、雲三大基石。其中「端」主要講的是設備互聯,「管」主要講的是內外互聯,「雲」主要強調的是雲計算、邊緣計算等內容。

對於藥物研發,很多人會認為藥物研發高深莫測,其實這些的確離大眾比較遠。產業互聯網的興起就是脫離的大眾的認知,將技術帶入到產業之中。

本次的主題是醫藥工業研發案例,那自然會有很多醫藥行業的知識在其中。具體AI如何能夠對醫藥工業的環境進行加速,手下我們必須了解都能在哪些地方加速。下圖中詳細的描述了各個應用場景中的一些內容。

對於沒有醫藥背景的夥伴,可能理解上稍微困難一些,不過可以體會如何分解具體的工業環節。

首先,我們通過工業語言的案例進行講解。

工業語言與我們平時說話是一樣的,只是用在了工業中的一種交流方式。這種語言形式具有科學性、行業性、通用性三個基礎要素。

分子圖像識別案例,可以解釋為一種工業語言提取技術。通過AI技術,可以將文獻中的分子式一次性提取出來並達到識別的效果。

這項技術具有諸多應用場景:首先可以對分子結構進行檢索操作,對於專利這類具有法律效力的文件,通過我們的技術可以一次性獲得該專利的所有保護化合物的保護邊界,極大的節省了專利分析師的人力成本,提高了效率。

本項目演算法分為三個階段:分子位置發現,使用目標檢測Mask RCNN相關技術完成;原子與鍵的識別,使用open CV相關技術完成;原子與鍵的表示,使用統計關係學習概率圖方式進行。

其中,化學式的表示使用MOL文件格式。

馬爾科夫邏輯網路,在於通過概率的形式將推斷式進行了軟化。這種方法其實就是一種推斷,將推斷的節點增加,就變為一個網路的形式,也就是概率圖。

第二個案例是我們在工業知識圖譜方面的項目,工業知識圖譜最重要的是將與工業生產中的知識結構化,構成知識圖譜的節點進行推斷。

知識圖譜是當前較為流行的AI技術體系,不過在工業中運用時,需要明確具體的使用場景,具體哪些環節可以用到該技術。

如下圖,在醫藥知識檢索、投資標地、藥物重定向、臨床路徑評估等過程中,都可以利用知識圖譜的相關技術滿足這些需求。

圖譜的構建過程大概分為如下圖闡述的幾個步驟:

通常來講,一個企業有三類數據源應該參與圖譜的構建過程。

  1. 企業內部數據:企業在生產過程中會闡述很多經驗性的內容數據,這些數據與業務結合緊密,可以作為構件圖譜的數據源。
  2. 外部公開數據:這類數據可能是一些知識庫的形式在互聯網中廣泛存在,比如與行業相關的行業資料,開源資料庫等。
  3. 外部付費數據:如果企業有資金可以購買一部分付費數據,那麼這部分數據具有非常規則的數據結構,可以納入圖譜中進行構建。

藥物知識圖譜可以篩選當前上市藥物中,哪些藥物對新冠病毒有療效。諸如此類應用場景,對整個醫藥工業以及全民健康具有深遠的意義,謝謝大家!!

#專欄作家#

白白,公眾號:白白說話(xiaob-talk)。人人都是產品經理專欄作家,醫藥行業資深產品專家,負責人工智慧行業類產品綜合架構與技術開發。在行業雲產品架構,藥物設計AI輔助、醫療知識圖譜等領域有深入研究。

本文原創發佈於人人都是產品經理。未經許可,禁止轉載。

題圖來自 Pexels,基於 CC0 協議

給作者打賞,鼓勵TA抓緊創作!