2017年12月,谷歌發(fā)布了一款新的人工智能工具,可利用基因測序數(shù)據(jù)準(zhǔn)確地構(gòu)建人類的基因組圖像。雖然科學(xué)家在約十五年前就已經(jīng)首次完成人類基因組的測序工作,但在十五年后的今天,理解編碼人類生命的海量數(shù)據(jù)仍然是艱難挑戰(zhàn),而這正是機器學(xué)習(xí)技術(shù)擅長解決的那類問題。
谷歌于2017年12月4日星期一發(fā)布了一款名為DeepVariant的工具。該工具使用最新的人工智能(AI)技術(shù),通過測序數(shù)據(jù)構(gòu)建更加準(zhǔn)確的人類基因組圖像。
DeepVariant可幫助將高通量測序讀數(shù)轉(zhuǎn)換為全基因組圖像。它會自動識別測序數(shù)據(jù)中的小型插入和缺失突變,以及單堿基對突變。
高通量測序技術(shù)在二十一世紀(jì)初得到廣泛應(yīng)用,讓基因組測序變得更加普遍。但使用此類系統(tǒng)生成的數(shù)據(jù)僅能提供有限且容易出錯的全基因組概況。對于科學(xué)家而言,將測序流程中生成的隨機錯誤與小型突變區(qū)分開來十分具有挑戰(zhàn)性,特別是在基因組的重復(fù)部分。這些突變可能會與癌癥等疾病直接相關(guān)。
目前存在多款可用于解讀此類讀數(shù)的工具,其中包括GATK、VarDict和FreeBayes。但是,這些軟件程序通常使用簡單的統(tǒng)計方法和機器學(xué)習(xí)方法,嘗試通過排除讀取錯誤來確定突變。
“其中一個挑戰(zhàn)在于基因組的疑難部分,每款[工具]都有其優(yōu)勢和劣勢,”測試過DeepVariant早期版本的哈佛大學(xué)公共衛(wèi)生學(xué)院研究科學(xué)家Brad Chapman表示?!斑@些疑難部分對于臨床測序工作而言日益重要,因而必須采用多種方法?!?/p>
DeepVariant由來自谷歌大腦(Google Brain)團隊(專注于開發(fā)和應(yīng)用人工智能技術(shù))和Verily(專注于生命科學(xué)領(lǐng)域的Alphabet[前身為谷歌]子公司)的研究人員開發(fā)。
該團隊通過Genome in a Bottle(瓶中基因組,GIAB)項目收集了數(shù)百萬高通量讀數(shù)及全測序基因組。這個項目是公立部門和私立部門聯(lián)合推動使用基因組測序工具及技術(shù)的成果。他們向深度學(xué)習(xí)系統(tǒng)提供數(shù)據(jù)并精心調(diào)整模型參數(shù),直到相關(guān)模型學(xué)會以高準(zhǔn)確度解讀測序數(shù)據(jù)。
2016年,DeepVariant在美國食品藥品監(jiān)督管理局(FDA)舉辦的PrecisionFDA Truth Challenge比賽中贏得了第一名,這項比賽旨在推動更加準(zhǔn)確地進行基因測序。
“DeepVariant的成功具有重要意義,因為它表明在基因組學(xué)領(lǐng)域,深度學(xué)習(xí)技術(shù)可用于自動訓(xùn)練表現(xiàn)優(yōu)于復(fù)雜手動操作系統(tǒng)的系統(tǒng),”加拿大Deep Genomics公司的首席執(zhí)行官Brendan Frey說道。
DeepVariant的發(fā)布是機器學(xué)習(xí)技術(shù)有望推動基因組學(xué)進步的最新標(biāo)志。
Deep Genomics是嘗試使用人工智能方法(例如深度學(xué)習(xí))梳理出疾病的發(fā)病基因并確定可能的藥物療法的數(shù)家公司之一。
-
人工智能
+關(guān)注
關(guān)注
1796文章
47678瀏覽量
240297
原文標(biāo)題:谷歌新人工智能工具可準(zhǔn)確構(gòu)建基因組圖像
文章出處:【微信號:AI_News,微信公眾號:人工智能快報】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論