吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

百度進軍生物計算領域 發布基于飛槳的生物計算平臺 - 螺旋槳 PaddleHelix

工程師鄧生 ? 來源:機器之心 ? 作者:機器之心 ? 2020-12-28 16:20 ? 次閱讀

百度正式發布基于飛槳的生物計算平臺 - 螺旋槳 PaddleHelix,進軍生物計算領域。

在本月 20 號召開的 WAVE SUMMIT+2020 深度學習開發者峰會上,百度正式發布了基于飛槳的生物計算平臺 - 螺旋槳 PaddleHelix,進軍生物計算領域。本次發布的螺旋槳 PaddleHelix 生物計算開源工具集,提供了包括 RNA 二級結構預測、大規模的分子預訓練、藥物 - 靶點親和力預測、以及 ADMET 成藥性預測等一系列算法和模型,重點滿足生物醫藥,疫苗設計和精準醫療方面的 AI 需求。

螺旋槳 PaddleHelix 官網地址:https://www.paddlepaddle.org.cn/paddle/paddlehelix

螺旋槳 PaddleHelixGitHub 地址:https://github.com/PaddlePaddle/PaddleHelix

生物醫藥

在生物醫藥領域,小分子化合物的篩選是非常關鍵的環節。為了設計出某種疾病的特效藥,一方面要找到能夠和疾病靶點結合、具有足夠活性的小分子藥物;另一方面又要保證藥物在人體內能夠正常發生作用,以及滿足一系列額外性質(藥物的吸收,分布,代謝,排泄,毒性,統稱 ADMET)。

靶蛋白(Protein)- 藥物配體(Ligand)復合物 (來源:PDBBind-cn.org)

傳統的藥物發現方法包括基于靶點結構的藥物設計(Structure Based Drug Design, SBDD),基于碎片的藥物設計(Fragment Based Drug Design, FBDD),老藥新用 (Repurposing),以及計算機虛擬藥物設計(Computational-Aided Drug Design, CADD)等等。這些方法均存在依賴體內(in vivo)體外 (in vitro) 實驗驗證,或者消耗大量計算資源等問題。因此近年來,基于分子的結構和知識來直接預測親和性的 AI 藥物設計(AIDD)逐漸被廣泛認可和應用。相比于 CADD,AIDD 展現出了性能上的巨大優勢,但其效果同時受到生物計算領域數據量的限制。下面的表格(表 1)展示生物計算一些重要問題的典型數據量,其中綠色的是有標注數據。我們看到,盡管這個領域有大量的無標注數據(僅有分子結構或者序列,沒有性質,或者次級結構),有標注數據卻非常少,難以支撐高質量的深度模型。

表 1

在 AI 的其他領域也存在類似問題。以自然語言處理為例,這個領域存在 NER,邏輯推斷,閱讀理解,文本生成等等非常多的子問題。這些問題中的有標注數據量都非常少。但是人類文明中累積了大量的無標注語言文字,這些無標注語料給自然語言處理提供了表示學習(Representation Learning)的機會。在這樣的背景下,BERT, ERNIE 等一系列基于自監督(Self-Supervised)學習的方法被提出。

正是基于此,螺旋槳 PaddleHelix 提出基于表示學習,多任務學習(Multi-Task Learning, MTL)和元學習(Meta Learning)來降低深度學習在生物計算中的技術和數據門檻,提升其效果。包括生物大分子(蛋白質,DNA,RNA)或者藥物小分子都由原子或者亞基組成,都可以通過序列,圖,或者三維結構表示。一種自然的想法,是像在自然語言處理領域一樣,利用無標注數據上的自監督學習來優化分子的表示,再將其應用到下游任務。同時,生物計算領域存在大量的零散的任務,以 ADMET 為例,有 30~50 個指標需要考慮。這樣的問題中,百度的生物計算團隊也認為多任務學習和元學習將會發揮重要作用。

螺旋槳 PaddleHelix 復現并內置了業界主流的分子預訓練模型(如表 2),以及常用的很多組網工具(CNN, Transformer, LSTM, ResNet,GNN 等等),開發者基于預訓練模型實現自己的模型只需要短短幾行代碼。螺旋槳 PaddleHelix 也提供了一些通過了驗證的,可以有效應用于下游任務的模型,效果如表 2 所示。

表 2:使用預訓練在分子性質預測中帶來顯著提升

疫苗設計

疫苗是通過把病毒或病菌相關的抗原(通常是蛋白)預先輸入人體,引起人體免疫反應的物質。傳統的疫苗需要體外制備抗原蛋白,通常效率低,難于快速大規模生產,因此可在人體自身內生產抗原蛋白的 mRNA 疫苗受到越來越多的關注。mRNA 疫苗制備速度快、無感染風險,但有一個天然劣勢就是 mRNA 非常不穩定,這與 mRNA 的二級結構相關。mRNA 疫苗設計的關鍵就在于,在不改變翻譯出的抗原蛋白的前提下,設計 mRNA 序列使其二級結構盡可能更穩定。

mRNA 疫苗示意圖(來源:https://translate.bio/)

百度研究院生物計算團隊從 2018 年開始就開展了 RNA 結構預測和序列設計相關研究,并在 2019 年 7 月和 2020 年 7 月分別發表了 LinearFold 和 LinearPartition 算法, 將 RNA 結構預測和分析的速度大大提升。其中 LinearFold 能夠在 27 秒內完成新冠病毒全基因組結構分析,比傳統算法速度提升 120 倍。正是有了之前的積累,百度研究院在短短兩個月就完成了 LinearDesign 的研發, 在 mRNA 疫苗設計上提出了革命性的方法。LinearDesign 能夠在 11 分鐘內完成新冠 mRNA 疫苗序列的設計,設計序列的穩定性和有效性大大提升。如圖所示,左邊是能翻譯新冠 S 蛋白的野生型 mRNA 二級結構,其中存在大量易斷裂的單鏈環。右邊是 LinearDesign 設計序列的結構,斷裂點更少,與野生型序列相比穩定性大大提升。百度研究院 RNA 結構預測與序列設計相關成果在美國 MIT 科技評論,以及美國消費者新聞與商業頻道(CNBC)得到了高度評價,并在 2020 年全球人工智能峰會(AI Summit)上獲得了 AI For Good(AI 向善)獎。

在螺旋槳 PaddleHelix 中,百度也完整開源了 LinearRNA 系列算法,目前主要包括 LinearFold 和 LinearPartition,開發者想要調用這些強大的工具僅僅需要一行代碼。

新冠 S 蛋白的野生型 mRNA 結構和 LinearDesign 結構

精準醫療

精準醫療(precision medicine)的概念是指,根據患者特征(patient characteristics)實現準確的疾病診斷和分類,從而進行個性化匹配用藥和跟蹤治療。相較于傳統的 one-size-fits-all 治療方案,精準醫療致力于通過臨床數據、生活環境、特別是分子組學數據精確刻畫個體特征,通過挖掘和探究隱含在多模態數據層面的信息進行綜合分析和判斷,最終提供更好更適配的藥物選擇和治療方案從而提升患者的治療效果最終提高個體的生存時間和生存質量。

部分圖片素材來自網絡

螺旋槳 PaddleHelix 也將提供基于多維數據(臨床隨訪數據、蛋白組數據、基因組數據、轉錄組數據、甲基化組數據、小 RNA 數據、單細胞組數據)的表示學習算法模型、藥物響應模型、疾病預后模型等,旨在幫助行業內的醫療專家、研究人員和從業者更好的利用組學數據和分子特征更精確的刻畫個體表示做組群區分,從而在精準醫療的三個維度預防、預測、治療(Prevention、Prediction、Treatment)構建更好更準確的醫療模型,幫助到更多的患者得到最好最適配的治療。

結語

在 WAVE SUMMIT+2020 深度學習開發者峰會上,百度集團副總裁、深度學習技術及應用國家工程實驗室副主任,吳甜女士對螺旋槳 PaddleHelix 的發展做了簡短的概述,希望未來與合作伙伴共建,逐步形成一套完整的面向行業的生物計算生態和服務。

我們也期待,螺旋槳 PaddleHelix 的發布能帶來更多的跨界驚喜,在生物醫藥、精準醫療、疫苗設計等領域發揮出更大的價值。

責任編輯:PSY

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 計算
    +關注

    關注

    2

    文章

    451

    瀏覽量

    38865
  • 百度
    +關注

    關注

    9

    文章

    2280

    瀏覽量

    90752
  • 生物
    +關注

    關注

    0

    文章

    49

    瀏覽量

    15781
  • 飛槳
    +關注

    關注

    0

    文章

    33

    瀏覽量

    2328
收藏 人收藏

    評論

    相關推薦

    dsPIC33EP32MC204無人機螺旋槳參考設計用戶指南

    電子發燒友網站提供《dsPIC33EP32MC204無人機螺旋槳參考設計用戶指南.pdf》資料免費下載
    發表于 01-22 15:48 ?1次下載
    dsPIC33EP32MC204無人機<b class='flag-5'>螺旋槳</b>參考設計用戶指南

    凌智電子榮獲“百度AI技術生態伙伴”認證

    )有限公司共建,致力于打造配套齊全、服務完善的人工智能協同創新中心,助力優化提升廈門市市人工智能產業生態。中心基于飛深度學習平臺+文心大模型,整合百度AI技術服務
    的頭像 發表于 01-04 14:10 ?179次閱讀
    凌智電子榮獲“<b class='flag-5'>百度</b>AI技術生態伙伴”認證

    百度進軍短劇領域,計劃全面升級平臺

    。這一舉動無疑預示著百度正在積極布局短劇市場,進一步拓展其內容生態。 對于此次進軍短劇領域的舉措,百度相關負責人給出了積極的回應。他表示,短劇作為當前內容生態的一個重要發展方向,已經受
    的頭像 發表于 12-19 10:25 ?230次閱讀

    百度正式回應進軍短劇領域

    近日,百度在線網絡技術(北京)有限公司在知識產權領域有了新的動作,據天眼查信息顯示,該公司已申請注冊“百度短劇”商標,涵蓋網站服務、科學儀器、教育娛樂等多個國際分類,目前這些商標均處于等待實質審查
    的頭像 發表于 12-17 14:19 ?252次閱讀

    百度Apollo開放平臺10.0正式發布

    12月4日,百度正式發布Apollo開放平臺的全新升級版本——Apollo開放平臺10.0,基于自動駕駛大模型ADFM設計重構算法,助力全球開發者和企業以更低成本、更高性能、更安全的技
    的頭像 發表于 12-04 16:20 ?463次閱讀

    百度發布AI智能眼鏡

    近日,有知情人士透露,百度旗下的人工智能品牌小計劃在即將舉行的百度世界大會上推出一款全新的AI智能眼鏡。這款眼鏡將內置先進的人工智能助手,并配備攝像頭,為用戶提供前所未有的智能體驗。
    的頭像 發表于 11-11 14:50 ?549次閱讀

    百度智能云發布千帆大模型平臺3.0

    2024年百度云智大會上,百度智能云震撼發布千帆大模型平臺3.0,標志著其在AI領域又一里程碑式的進步。新版
    的頭像 發表于 09-26 14:51 ?494次閱讀

    百度舸AI計算平臺4.0震撼發布

    在2024年百度云智大會的璀璨舞臺上,百度智能云重磅推出了舸AI異構計算平臺的全新力作——4.0版本。此次升級,標志著
    的頭像 發表于 09-26 14:46 ?530次閱讀

    NVIDIA與百度攜手革新汽車風阻預測:DNNFluid-Car模型的崛起

    在追求更高效、更環保的汽車設計浪潮中,NVIDIA與百度攜手突破傳統界限,共同研發了一款革命性的3D高精度汽車風阻預測模型——DNNFluid-Car。這款模型不僅標志著AI技術在汽車空氣動力學數值模擬領域的重大進展,更以其
    的頭像 發表于 07-09 14:56 ?1701次閱讀

    百度發布文心大模型4.0 Turbo與飛框架3.0,引領AI技術新篇章

    SUMMIT深度學習開發者大會2024上,向世界展示了百度在AI領域的最新成果——文心大模型4.0 Turbo和飛框架3.0,并詳細披露了飛文心生態的最新發展動態。
    的頭像 發表于 06-29 16:03 ?723次閱讀

    百度文心大模型4.0 Turbo,正式發布 用戶規模已達3億

    的最新數據,并正式發布文心大模型4.0 Turbo、飛框架3.0等最新技術,披露飛文心生態最新成果。 ?01?文心大模型4.0 Turbo發布? 文心一言用戶規模達3億 大會現場,
    的頭像 發表于 06-29 10:06 ?922次閱讀

    電化學生物傳感器在生物檢測領域的顯著優勢

    電化學生物傳感器在生物檢測領域具有顯著的優勢,這些優勢不僅體現在其高靈敏、快速響應等方面,更在于其在醫學診斷、環境監測、食品安全等多個領域
    的頭像 發表于 04-29 10:00 ?832次閱讀
    電化學<b class='flag-5'>生物</b>傳感器在<b class='flag-5'>生物</b>檢測<b class='flag-5'>領域</b>的顯著優勢

    百度沈抖沈抖正式發布新一代智能計算操作系統—萬源

    4月16日,Create 2024 百度AI開發者大會在深圳召開。期間,百度集團執行副總裁、百度智能云事業群總裁沈抖正式發布新一代智能計算
    的頭像 發表于 04-18 09:22 ?474次閱讀
    <b class='flag-5'>百度</b>沈抖沈抖正式<b class='flag-5'>發布</b>新一代智能<b class='flag-5'>計算</b>操作系統—萬源

    百度沈抖:傳統云計算不再是主角,智能計算呼喚新一代“操作系統”

    4月16日,Create 2024 百度AI開發者大會在深圳召開。期間,百度集團執行副總裁、百度智能云事業群總裁沈抖正式發布新一代智能計算
    發表于 04-16 16:26 ?344次閱讀
    <b class='flag-5'>百度</b>沈抖:傳統云<b class='flag-5'>計算</b>不再是主角,智能<b class='flag-5'>計算</b>呼喚新一代“操作系統”

    百度智能云正式發布了《百度智能云水業大模型白皮書》

    3月28日,由E20環境平臺主辦的2024(第二十二屆)水業戰略論壇在北京召開。會上,百度智能云正式發布了《百度智能云水業大模型白皮書》(以下簡稱《白皮書》)。
    的頭像 發表于 03-29 09:20 ?1417次閱讀
    <b class='flag-5'>百度</b>智能云正式<b class='flag-5'>發布</b>了《<b class='flag-5'>百度</b>智能云水業大模型白皮書》
    威尼斯人娱乐城老品牌lm0 | 大发888下载 df888gfxzylc8| 玩百家乐官网澳门368娱乐城| 百家乐桌定制| 百家乐官网园千术大全| 澳门百家乐娱乐城怎么样| 联兴棋牌| 百家乐开过的路纸| 百家乐官网真人投注网站| 百家乐高手怎么下注| 真人百家乐官网视频赌博| 新濠百家乐娱乐场| 百家乐官网赌马| 大发888官方备用| 百家乐官网必胜方法如果你还想继续不看可能后悔一生 | 大地娱乐城| 百家乐楼梯缆 | 威尼斯人娱乐城惊喜| 运城百家乐官网蓝盾| 大发888备用网址大全| 百家乐官网娱乐平台代理佣金| 衢州星空棋牌下载| 百家乐概率投注| 百家乐官网的胜算法| 百家乐套利| 百家乐官网博娱乐赌百家乐官网的玩法技巧和规则 | 澳门百家乐官网规则| 全讯网3344111| 阴宅风水24山分金| 百家乐官网是赌博吗| 威尼斯人娱乐城 老品牌值得您信赖| 十三张百家乐官网的玩法技巧和规则 | 988百家乐官网娱乐| 澳门足球博彩官网| 百家乐筹码桌| 百家乐在线投注系统| 百家乐官网稳赢投注| 88娱乐城官网| 老虎百家乐的玩法技巧和规则| 涂山百家乐官网的玩法技巧和规则| 墨竹工卡县|