當藥物研發遇上人工智慧

2017年年中,加州聖布魯諾的Numerate公司與武田葯業(Takeda Pharmaceutical)正式簽約,就使用Numerate公司的人工智慧技術(artificial intelligence, AI)尋找腫瘤學、胃腸病學和中樞神經系統疾病的小分子藥物展開合作。與此同時,麻省GNS Healthcare公司宣布與位於加州南舊金山的Roche子公司Genentech達成協議,使用GNS的AI平台分析已知療法在腫瘤學中的功效。2017年5月,蘇格蘭Exscientia公司與法國Sanofi簽署了一項潛在價值為2.5億歐元(約2.8億美金)的合作和許可交易,旨在開發針對代謝疾病的雙特異性小分子藥物。Exscientia將利用其人工智慧技術設計化合物,而Sanofi則提供化學合成。近年來,葯企和AI公司攜手的案例比比皆是。長期以來,葯企對AI技術懷有質疑,但由於AI技術有潛力解決藥物開發過程的難題——臨床失敗率,葯企開始看好,甚至引入AI。

Advertisements

葯企對AI技術的興趣主要源於這樣一個事實:傳統的藥物研發耗時耗力,且失敗率高。20年來臨床成功率持續下降,直到最近才有所改善。然而,現在進入臨床1期的藥物中只有十分之一能通過整個臨床試驗。倫敦BenevolentAI分公司BenevolentBio的首席執行官Jackie Hunter指出,有一半的臨床試驗失敗是由於候選藥物缺乏有效性。也就是說靶標不對,即使降低5%或10%的治療失敗率,也能非常讓人吃驚。Hunter對AI在藥物研發上的潛力的看法在2017年發布的《安永:2017全球生物技術報告》(Ernst & Young』s Biotechnology Report 2017)中有所介紹。

Advertisements

一直觀望AI發展的公司現在紛紛涉足AI領域。最著名的藥物研發深度學習模型可能是IBM的Watson機器人。IBM於2016年12月與Pfizer公司簽署協議,協助Pfizer的免疫腫瘤藥物研發,除此之外,IMB還和多個葯企有合作協議(Nat.Biotechnol. 33, 1219-1220, 2015)。IBM的Watson機器人可以快速分析大量的文本數據,並使用大量實驗室數據、臨床報告和科學出版物測試猜想,以此來尋找潛在藥物(BenevolentAI挖掘文獻和研究資料庫的演算法與沃森非常類似)。

生物醫學的海量數據驅動了製藥行業對AI的興趣(表1)。不斷增加的計算能力和大型數據集的擴散促使科學家們尋求可以幫助他們瀏覽大量信息的學習演算法。

葯企對AI的興趣其實是受其它領域的感染的。常用於無人駕駛汽車的機器視覺,以及語言處理,為複雜的多級人造神經網路——深度學習演算法的誕生奠定了基礎。在生物領域,深度學習可基於測定數據和文本數據建立生物過程模型。

耶魯大學生物(Yale University)醫學信息學教授Mark Gerstein指出,過去人們沒有足夠的數據來適當地訓練深度學習演算法。但是現在研究人員已經能夠建立大量的資料庫,並利用這些數據來訓練演算法了。Gerstein認為葯企對AI的看好是很有道理的。

Numerate公司是越來越多的、將數據用於藥物發現的AI公司之一。Numerate首席執行官Guido Lanza表示,他們將AI應用於各個階段的化學設計。Numerate和東京Takeda公司合作,篩選靶標分子,設計和優化化合物,對藥物吸收、分佈、代謝和排除以及毒性進行建模,為Takeda提供臨床試驗候選藥物。該協議的金額和特許權使用費並未披露。

不光葯企,學術實驗室也開始採用AI工具。2017年4月,舊金山Atomwise公司發起了人工智慧分子篩選獎勵計劃(Artificial Intelligence Molecular Screen),向多達100個大學研究實驗室免費提供72種潛在的治療化合物。Atomwise是多倫多大學的校友創業公司,並於2015年與默克公司達成合作。Atomwise將使用AtomNet平台篩選1000萬個分子,並為每個實驗室提供72個靶向該實驗選擇的靶標的化合物。

日本政府於2016年推出了一個研究聯盟,旨在幫助國內數十家公司和機構使用日本K超級計算機,從而提高藥物發現效率。其中包括Takeda、Fujitsu、NEC、京都大學醫院(Kyoto University Hospital)、日本理化學研究所(RIkagaku KENkyusho/Institute of Physical and Chemical Research, Riken),以及提供臨床資料的日本國家研究發展研究所(Japan's National Research and Development Institute)。

基因組數據分析初創公司WuXi NextCode與耶魯大學(Yale University)的研究人員合作,共同使用該公司的深度學習演算法來識別血管生長的關鍵機制。結果可以推動抑制腫瘤血管生長的藥物研發。

美國奧巴馬政府期間,作為癌症登月計劃(Cancer Moonshot initiative)的一部分,工業和學術界聯合力量,應用人工智慧加速藥物發現。在2016年1月推出的加速醫學治療研發計劃(Accelerating Therapeutics for Opportunities in Medicine, ATOM)中,英國GSK公司、加州利勞倫斯利物莫國家實驗室(Lawrence Livermore National Laboratory)和美國國家癌症研究所(US National Cancer Institute)強強聯手,將計算方法和實驗方法結合起來,推動腫瘤藥物研發。該計劃的計算部分,包括深度學習和其它AI演算法,將在頭兩年內接受測試。GSK公司的負責人Martha Head表示,他們希望一開始就有一個正確的假設,然後一年內推出候選藥物。

學術實驗室研發的AI技術引發了AI創業大潮,並促進了致力於加速藥物發現的合作。2017年下半年,巴爾的摩的Insilico醫學公司公布了ALS.AI,一個致力於肌萎縮性側索硬化症的個性化藥物發現和生物標誌物開發平台。該公司主要從學術界吸取教訓,專註於生成拮抗網路——一種深度學習演算法,它能令兩個神經網路建立拮抗關係,其中一個網路嘗試開發一個模型,並不斷改進這個模型,直到第二個網路無法區分模型是否處於構建階段。該公司使用該工具分析在不同分子孵育情況下,人類細胞系的轉錄和轉錄反應數據的資料庫,以預測分子的治療性質。Insilico醫藥公司首席執行官Alex Zhavoronkov表示,他們主要觀察正常組織和疾病組織的基因的表達變化。然後他們看看什麼分子可以改變這個差異。AI還有可能將演算法應用於表型和定性分析(一般需要幾周,甚至數月)以加快臨床前開發過程。

但是,作為藥物發現工具,AI需要數據集才能進行培訓,而數據訪問仍然是一個重大挑戰。大型製藥公司擁有可追溯到20世紀80年代的大型臨床前數據集,這部分數據可能可以被共享。實際上,許多公司都參加了各種化合物分享和再利用計劃。Heads指出GSK正在向ATOM提供測定數據、遺傳數據、藥物代謝和葯代動力學數據。她認為她們提供了一些進入臨床試驗,但因為種種原因失敗的分子的相關數據,同時還有來自她們早期發現過程的大量數據。Numerate的首席技術官Brandon Allgood表示,儘管如此,在許多情況下,大型製藥公司的數據組織形式並不完善,這需要數字化才能有用,才能『有東西可挖』」。

另一個挑戰是成本了。在機器視覺領域,研究人員可以建立大量的數據集,因為每個數據點的成本是微不足道的。但在製藥行業,數據點可就非常昂貴了,因此製藥行業不需要大量數據的演算法。為此,斯坦福大學(Stanford University)的研究人員將一類計算機視覺演算法、單點學習的演算法進行調整,使其適用於藥物研發,最後得到一種可以根據非常少的數據來對藥物屬性進行預測的演算法。

Allgood指出,展望未來,深度學習和其它AI演算法,以及硬體和軟體的進步都有望對藥物研發產生重大影響。此外,理論上,小分子藥物的種類可以達到1060左右。Allgood還提出,在做決定之前,「我們應該利用所有的數據,建立N個新模型,儘可能探索更多的分子類型。」

人造智能領域的最大項目是Google的深度學習項目Google Brain。目前該項目已經聘請了許多世界領先的人工智慧研究人員。Google Brain的團隊一直在擴大,並且最近針對量子化學的深度學習進行了調整。業內許多人表示,就算谷歌的母公司Alphabet在不久的將來開一家AI藥物研發公司,他們都不會驚訝。

但是,只有當AI公司真的能提高藥物開發成功率時,AI技術才會成為生物藥物開發的主導。Insilico Medicine的Zhavoronkov指出,到目前為止,生物信息學並沒有提高藥物開發的成功率,這使得大型製藥公司對AI的「巨大潛力」心懷警惕。Zhavoronkov不認為業內對AI有多信任,但是興趣確實很大。只有當製藥領域也出現第一個成功案例,整個行業才會真正引入AI。

免責聲明:轉載自網路 不用於商業宣傳 版權歸原作者所有 侵權刪

Advertisements

你可能會喜歡