吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

應(yīng)用深度學習分析提高基因組分析的準確性

Tensorflowers ? 來源:TensorFlow ? 作者:Howard Yang ? 2021-05-14 09:49 ? 次閱讀

發(fā)布人:Google Health Genomics 產(chǎn)品負責人 Andrew Carroll 和 Genomics 項目經(jīng)理 Howard Yang

Google Health 的 Genomics 團隊很高興分享我們對 DeepVariant 的最新擴展 - DeepTrio。

DeepVariant 于 2017 年首次發(fā)布,是一種開源工具,支持研究人員和臨床醫(yī)生分析個人的基因組測序數(shù)據(jù)并識別基因變異,如可導(dǎo)致疾病的變異片段。我們在 DeepVariant 方面的持續(xù)研究因其一流的準確性而獲得肯定。借助 DeepTrio,我們擴展了 DeepVariant,從而能夠在分析母親-父親-子女三人的基因序列數(shù)據(jù)時考量基因變異。

人類是二倍體生物,攜帶人類基因組的兩個副本。每個個體都分別繼承了來自母親和父親的一個基因組副本。父母遺傳信息有助于分析符合孟德爾遺傳規(guī)律的特征和疾病。DeepTrio 學習直接在測序數(shù)據(jù)中使用孟德爾遺傳的特性,以便在可以共同分析父母和子女樣本的情況下更準確地識別基因變異。

修改 DeepVariant 以分析三人樣本

DeepVariant 學習到如何將基因組中的位置分類為參考或者“基因組瀏覽器”(相關(guān)專家用于分析的工具)中數(shù)據(jù)表示的變種。“《使用 DeepVariant1.0 提高基因組分析的準確性》(Improving the Accuracy of Genomic Analysis with DeepVariant 1.0)”一文很好地概述了有關(guān)內(nèi)容。

使用 DeepVariant1.0 提高基因組分析的準確性

https://ai.googleblog.com/2020/09/improving-accuracy-of-genomic-analysis.html

DeepVariant 接收數(shù)據(jù)作為以候選變異為中心的基因組窗口,并且按照要求將數(shù)據(jù)分類為參考(無變異)、雜合子(變異的一個副本)或純合子(兩個副本均為變異)。DeepVariant 將序列證據(jù)視為代表數(shù)據(jù)特征的通道(請參閱“《透過 DeepVariant 深入觀察》(Looking through DeepVariant’s eyes)”獲取更深入解釋)。

透過 DeepVariant 深入觀察

我們修改了 DeepTrio,以在單個圖像中表示來自三人的序列數(shù)據(jù),其中每個樣本的高度固定,子女的數(shù)據(jù)置于中間。我們使用來自美國國家標準與技術(shù)研究院 (NIST) 瓶中基因組聯(lián)盟 (GIAB) 的黃金標準樣本作為真實標簽,訓練一個模型調(diào)用子女樣本中的變異,并訓練另一個模型調(diào)用頂部父母樣本中的變異。為調(diào)用父母雙方的樣本,我們翻轉(zhuǎn)父母樣本的位置。

衡量 DeepTrio 提高的準確性

我們研究發(fā)現(xiàn),對于父母和子女變異檢測,DeepTrio 比 DeepVariant 更準確,在覆蓋率較低的情況下具有特別明顯的優(yōu)勢。這使研究人員能夠以更高的準確性分析樣本,或者在顯著降低費用的同時保持相當?shù)臏蚀_性。

為評估 DeepTrio 的準確性,我們借助 NIST 瓶中基因組聯(lián)盟提供的涵蓋廣泛特征的黃金標準,將其與 DeepVariant 的準確性進行比較。為獲得在訓練中從未見過的評估數(shù)據(jù)集,我們在訓練中排除了 20 號染色體,并對 20 號染色體進行了評估。

我們訓練 DeepVariant 和 DeepTrio,以對來自兩種不同儀器 Illumina 和 Pacific Biosciences (PacBio) 的數(shù)據(jù)進行測序。如要詳細了解這些技術(shù)之間的差異,請參見我們之前的博客。這些測序儀均以容易錯誤的方式隨機采樣基因組。為準確分析基因組,我們需要重復(fù)采樣相同區(qū)域。在某個位置的采樣深度稱為覆蓋范圍。以近似線性的方式測序來覆蓋更大的范圍將導(dǎo)致成本更高。因此我們經(jīng)常需要在成本、準確性和測序樣本之間進行權(quán)衡。而權(quán)衡的結(jié)果是,在三人樣本中,父母樣本通常以較低的深度進行測序。

在下方圖表中,我們繪制了一系列不同覆蓋范圍中 DeepTrio 和 DeepVariant 的準確性。

00077b0a-b42c-11eb-bf61-12bb97331649.png

001e90f6-b42c-11eb-bf61-12bb97331649.png

圖 2.子女樣本(頂部)和父母樣本(底部)上 DeepTrio(實線)和 DeepVariant(虛線)的 F1 得分,使用 Illumina(藍色)和 PacBio(黑色)儀器進行測序。在具有一系列測序覆蓋范圍(x 軸)的樣本中,對 20 號染色體上所有類型的小變異進行 F1 測量

DeepTrio 在 de novo 變異上的表現(xiàn)

相對于人類參考基因組,每個人大約有 500 萬處變異,其中絕大多數(shù)從父母處繼承而來。一小部分(大約 100 處)是新變異(稱為 de novo),由 DNA 復(fù)制過程中的復(fù)制錯誤導(dǎo)致。我們的研究證明,DeepTrio 大大減少了 de novo 變異檢測的假陽性情況。對于 Illumina 數(shù)據(jù),其真陽性回收率的下降幅度較小,而對于 PacBio 數(shù)據(jù),這種權(quán)衡不會發(fā)生。

為評估準確性,我們分析了父母兩人都被稱為非變異但子女被稱為雜合變異的位點。我們觀察到 DeepTrio 更不愿意將變異命名為 de novo,這類似于人類對于違反孟德爾遺傳規(guī)律的位點,需要獲得更高水平的證據(jù)。因此,此類 de novo 變異的假陽性率低得多,但 DeepTrio Illumina 的召回率則略低。通常,在發(fā)生這種情況時,子女的樣本仍將稱作變異,但父母樣本則給予“不調(diào)用”的判斷(分類器沒有足夠的信心進行調(diào)用)。

促進罕見病研究

通過將 DeepTrio 作為開源軟件發(fā)布,我們希望這一軟件能夠支持科學家更準確地分析樣本,進而提升對基因組數(shù)據(jù)的分析能力。我們希望這能促進研究和臨床開發(fā),進而更好地解析罕見病病例,并改進治療方法的開發(fā)。

除了將 DeepTrio 的代碼作為開放源代碼發(fā)布之外,我們還發(fā)布了為訓練這些模型而生成的測序數(shù)據(jù)。這些數(shù)據(jù)會在預(yù)印本“《用于基準測試和開發(fā)的黃金標準樣本的廣泛序列數(shù)據(jù)集》(An Extensive Sequence Dataset of Gold-Standard Samples for Benchmarking and Development)”中加以說明。通過發(fā)布該生產(chǎn)模型和訓練相似復(fù)雜度模型所需的數(shù)據(jù),我們希望能為基因組學界的方法開發(fā)做出貢獻。

原文標題:應(yīng)用深度學習分析家庭基因組數(shù)據(jù)

文章出處:【微信公眾號:TensorFlow】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3407

    瀏覽量

    42713
  • 深度學習
    +關(guān)注

    關(guān)注

    73

    文章

    5515

    瀏覽量

    121553

原文標題:應(yīng)用深度學習分析家庭基因組數(shù)據(jù)

文章出處:【微信號:tensorflowers,微信公眾號:Tensorflowers】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    如何提高OTDR測試的準確性

    OTDR(光時域反射儀)是光纜線路故障定位和光纖特性測量的重要工具,提高OTDR測試的準確性對于確保光纜線路的穩(wěn)定運行至關(guān)重要。以下是一些提高OTDR測試準確性的方法: 一、
    的頭像 發(fā)表于 12-31 09:25 ?317次閱讀

    如何提高電位測量準確性

    在電子工程和物理實驗中,電位測量是一項基本而重要的任務(wù)。電位測量的準確性直接影響到實驗結(jié)果的可靠和產(chǎn)品的安全。 1. 選擇合適的測量設(shè)備 選擇合適的測量設(shè)備是提高電位測量
    的頭像 發(fā)表于 12-28 13:56 ?212次閱讀

    如何提升ASR模型的準確性

    提升ASR(Automatic Speech Recognition,自動語音識別)模型的準確性是語音識別技術(shù)領(lǐng)域的核心挑戰(zhàn)之一。以下是一些提升ASR模型準確性的關(guān)鍵方法: 一、優(yōu)化數(shù)據(jù)收集與處理
    的頭像 發(fā)表于 11-18 15:14 ?1182次閱讀

    GPU深度學習應(yīng)用案例

    能力,可以顯著提高圖像識別模型的訓練速度和準確性。例如,在人臉識別、自動駕駛等領(lǐng)域,GPU被廣泛應(yīng)用于加速深度學習模型的訓練和推理過程。 二、自然語言處理 自然語言處理(NLP)是
    的頭像 發(fā)表于 10-27 11:13 ?508次閱讀

    如何評估 ChatGPT 輸出內(nèi)容的準確性

    評估 ChatGPT 輸出內(nèi)容的準確性是一個復(fù)雜的過程,因為它涉及到多個因素,包括但不限于數(shù)據(jù)的質(zhì)量和多樣、模型的訓練、上下文的理解、以及輸出內(nèi)容的邏輯一致。以下是一些評估 ChatGPT 輸出
    的頭像 發(fā)表于 10-25 17:48 ?681次閱讀

    如何保證測長機測量的準確性

    可以通過以下方法保證測長機測量的準確性:一、設(shè)備方面1.定期校準按照規(guī)定的時間間隔,將測長機送往專業(yè)的計量機構(gòu)或使用標準器進行校準。校準可以確定測長機的測量誤差,并對其進行調(diào)整,確保測量結(jié)果的準確性
    的頭像 發(fā)表于 10-25 16:16 ?406次閱讀
    如何保證測長機測量的<b class='flag-5'>準確性</b>?

    AI大模型與深度學習的關(guān)系

    人類的學習過程,實現(xiàn)對復(fù)雜數(shù)據(jù)的學習和識別。AI大模型則是指模型的參數(shù)數(shù)量巨大,需要龐大的計算資源來進行訓練和推理。深度學習算法為AI大模型提供了核心的技術(shù)支撐,使得大模型能夠更好地擬
    的頭像 發(fā)表于 10-23 15:25 ?1278次閱讀

    【飛凌嵌入式OK3576-C開發(fā)板體驗】RKNPU圖像識別測試

    、智能監(jiān)控攝像頭、智能穿戴設(shè)備等物聯(lián)網(wǎng)應(yīng)用的智能化和自動化。 醫(yī)療健康 :在醫(yī)學影像分析、疾病診斷、基因組學等領(lǐng)域加速大規(guī)模數(shù)據(jù)的處理和分析提高診斷的
    發(fā)表于 10-10 09:27

    HPLC數(shù)據(jù)怎么分析處理

    高效液相色譜(HPLC)是一種常用的分析技術(shù),廣泛應(yīng)用于化學、生物、醫(yī)藥、食品等領(lǐng)域。HPLC數(shù)據(jù)分析處理是實驗過程中非常重要的一環(huán),對于實驗結(jié)果的準確性和可靠性具有重要意義。 一、HPLC數(shù)據(jù)
    的頭像 發(fā)表于 08-08 10:54 ?1682次閱讀

    影響電源紋波測試準確性的因素

    電源紋波測試是評估電源質(zhì)量的重要手段之一,它能夠反映出電源在輸出電壓中的波動情況。然而,測試過程中的多種因素都可能對測試結(jié)果的準確性產(chǎn)生影響。本文將從多個方面分析影響電源紋波測試準確性的因素,并提
    的頭像 發(fā)表于 08-02 09:42 ?707次閱讀

    深度學習模型訓練過程詳解

    深度學習模型訓練是一個復(fù)雜且關(guān)鍵的過程,它涉及大量的數(shù)據(jù)、計算資源和精心設(shè)計的算法。訓練一個深度學習模型,本質(zhì)上是通過優(yōu)化算法調(diào)整模型參數(shù),使模型能夠更好地擬合數(shù)據(jù),
    的頭像 發(fā)表于 07-01 16:13 ?1506次閱讀

    8芯M16插頭數(shù)據(jù)傳輸?shù)?b class='flag-5'>準確性

      德索工程師說道8芯M16插頭作為高性能連接器,其數(shù)據(jù)傳輸?shù)?b class='flag-5'>準確性對于整個系統(tǒng)的穩(wěn)定性和可靠至關(guān)重要。以下是對8芯M16插頭數(shù)據(jù)傳輸準確性的詳細分析,結(jié)合參考文章中的相關(guān)數(shù)字和信息
    的頭像 發(fā)表于 06-14 18:06 ?372次閱讀
    8芯M16插頭數(shù)據(jù)傳輸?shù)?b class='flag-5'>準確性</b>

    測量時鐘信號的探頭要求:確保準確性與穩(wěn)定性

    時鐘信號在現(xiàn)代電子系統(tǒng)中起著至關(guān)重要的作用。為了準確測量和分析時鐘信號,選擇合適的探頭至關(guān)重要。本文將探討測量時鐘信號時探頭的要求,包括帶寬、阻抗匹配、信號完整和噪聲抑制等方面,以確保測量的
    的頭像 發(fā)表于 04-22 10:44 ?1016次閱讀
    測量時鐘信號的探頭要求:確保<b class='flag-5'>準確性</b>與穩(wěn)定性

    電流探頭測試小技巧:提高準確性和安全

    電流探頭是一種常用的測試工具,用于測量電路中的電流。正確使用電流探頭可以提高測試的準確性,并確保操作的安全。本文將介紹一些電流探頭的測試小技巧,幫助您更好地使用電流探頭進行電流測量。 技巧一:正確
    的頭像 發(fā)表于 03-08 09:31 ?417次閱讀
    電流探頭測試小技巧:<b class='flag-5'>提高</b><b class='flag-5'>準確性</b>和安全<b class='flag-5'>性</b>

    FLOEFD T3STER自動校準模塊—提高電子產(chǎn)品散熱設(shè)計的準確性

    西門子工業(yè)數(shù)字軟件FLOEFD T3STER 自動校準模塊——提高電子產(chǎn)品散熱設(shè)計的準確性
    的頭像 發(fā)表于 02-21 10:10 ?653次閱讀
    FLOEFD T3STER自動校準模塊—<b class='flag-5'>提高</b>電子產(chǎn)品散熱設(shè)計的<b class='flag-5'>準確性</b>
    9人百家乐官网桌布| 百家乐游戏机子| 大发888在线娱乐合作伙伴| 百家乐官网免费改单| 博雅德州扑克下载| 百家乐也能赢钱么| 真人百家乐官网大转轮| 百家乐官网透明发牌机| 玛纳斯县| 二爷百家乐的玩法技巧和规则| 宝马会百家乐官网娱乐城| 丰合娱乐| 天天百家乐的玩法技巧和规则| 百家乐官网如何捕捉长龙| 四房播播| 百家乐保证赢| 圆梦城百家乐官网娱乐城| 皇冠代理网| 博天堂百家乐的玩法技巧和规则| 百家乐官网b28博你| 玉龙| 赌王百家乐的玩法技巧和规则| 凱旋门百家乐官网的玩法技巧和规则 | 百家乐信息| 贵宾百家乐官网的玩法技巧和规则 | 德州扑克怎么发牌| 百家乐赌场怎么玩| 博彩百家乐官网最新优惠| 百家乐官网是赌博吗| 大发888娱乐真钱游戏下载| 百家乐赌场详解| 老钱庄百家乐官网的玩法技巧和规则 | 职业百家乐官网的玩法技巧和规则 | 威尼斯人娱乐城官网地址| 百家乐论坛百科| 百家乐官网猜大小规则| 线上龙虎| 威尼斯人娱乐城总部| 百家乐筹码方形筹码| CEO百家乐官网现金网| 老虎机|