乳腺癌是美國第二大、中國第一大女性惡性腫瘤相關(guān)的致死因素。2019年的最新數(shù)據(jù)顯示,美國有近27萬名女性被診斷為乳腺癌,4萬多人因此死亡。在中國,僅2015年就有約28萬乳腺癌新發(fā)病例,位居女性惡性腫瘤發(fā)病的首位。在現(xiàn)代醫(yī)學的眾多研究領(lǐng)域中,如何盡早發(fā)現(xiàn)和治療乳腺癌,早已成為一個十分重要的核心課題。
近日,來自麻省理工學院計算機科學與人工智能實驗室(MIT CSAIL)和馬薩諸塞州綜合醫(yī)院的研究人員合作,共同打造出了一種深度學習模型。通過分析約9萬張乳腺X光照片與6萬多名患者的真實數(shù)據(jù),該模型可以找出人眼不易察覺的精細信息和規(guī)律,作為預測女性是否可能在未來五年內(nèi)罹患乳腺癌的依據(jù)。相比于傳統(tǒng)檢測模型,該模型將預測準確率從18%提高到31%,在不同族裔女性罹患乳腺癌風險的預測普適性上取得突破。
新的深度學習模型可以在癌癥發(fā)病(右圖)前4年,識別出乳腺癌風險(左圖)
個性化檢查方案,抓住最佳治療時機
乳腺X光檢查技術(shù)是目前臨床醫(yī)學廣泛使用的檢測乳腺癌風險的手段,但業(yè)界對檢查頻次和合適的檢查年齡一直存在爭議。美國癌癥協(xié)會認為女性應從45歲開始進行年度檢查,有些機構(gòu)則建議50歲以上的女性每兩年接受一次檢查。不過由于個人體質(zhì)各異,其罹患乳腺癌的風險也不同,以年齡作為標準劃分篩查頻率過于泛化,很容易無法及時發(fā)現(xiàn)早期乳腺癌而錯失最佳治療時機。另外,由于X光的輻射性和乳腺的敏感性,很多人甚至認為乳腺癌X光篩查對女性有一定危害。
針對這一情況,MIT的研究人員認為如果能夠提前預測出女性罹患乳腺癌的風險系數(shù),可以幫助個體制定更完善的個性化篩查方案,如建議高危人群在 30 多歲時進行年度檢查,低危人群則每三年檢查一次。該論文的作者之一Regina Barzilay博士是乳腺癌幸存者,她希望通過該模型幫助更多女性將乳腺癌風險扼殺在搖籃中,抑制其發(fā)病率增長趨勢。
Regina Barzilay博士
設(shè)計檢測模型,獲取精準信息
自1989年第一個乳腺癌風險預測模型誕生以來,很多風險因素被囊括在內(nèi):年齡、家族遺傳、荷爾蒙和生殖激素、乳腺密度等。但是由于大多數(shù)因素與乳腺癌的關(guān)聯(lián)度較低,導致這些傳統(tǒng)模型對個體的預測并不準確。
與傳統(tǒng)的檢測模型不同,MIT的研究團隊開發(fā)出了一種全新的深度學習模型——基于邏輯回歸模型+圖片識別深度學習模型的混合模型,使用乳腺X光照片與真實已知結(jié)果對模型進行訓練、驗證和測試。
“1960年以來,放射科醫(yī)生已經(jīng)注意到女性乳腺X光片上可以看到各具特性且不斷變化的乳房組織,代表著遺傳、激素、懷孕、哺乳、飲食、體重變化對乳腺產(chǎn)生的影響?,F(xiàn)在我們可以利用深度學習在風險評估中更準確地利用這些詳細信息,從而提出個性化的預測結(jié)果和預防方案。”Regina Barzilay表示。
首先,每一個風險因素都會經(jīng)過獨熱編碼(one-hot encoding)——一種在機器學習中常見的變量轉(zhuǎn)換機制,將變量的狀態(tài)用 0 和 1 組成的二進制向量表示,再將所有編碼整合組成風險因素向量,作為邏輯回歸模型(risk-factor-based logistic regression model: RF-LR)的輸入值。
在此基礎(chǔ)上,研究人員又開發(fā)了一套以深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)為核心的圖片識別模型(image-only DL),使用開源的預訓練模型 ResNet-18 。他們沒有根據(jù)圖片分辨率變化調(diào)整模型,直接以1664 x 2048 像素的乳腺X 光照片作為輸入值進行訓練。
風險因素的訓練、驗證及測試
最后,他們整合了邏輯回歸和圖像識別兩個模型,制作了一個混合模型(Hybrid DLModel)。結(jié)合風險因素和圖像信息,該模型開始學習預測女性在五年內(nèi)是否會出現(xiàn)乳腺癌風險。
幾種模型預測準確率的比較
以乳腺密度為例,與目前臨床上使用乳腺密度作為評估乳腺癌風險標準的Tyrer-Cuzick模型相比,該模型識別風險的準確率有所提高。研究人員發(fā)現(xiàn),高乳腺密度且模型評估乳腺癌風險高的患者癌癥發(fā)病率,是乳腺密度和乳腺癌風險都較低的患者的3.9倍。這一趨勢在不同女性群體中都體現(xiàn)了出來。
對不同族裔的女性預測準確率相同
值得注意的是,該論文提出的深度學習模型提高了對不同族裔女性的預測適用性,而包括Tyrer-Cuzick模型在內(nèi)的很多現(xiàn)有模型大多依照白人女性數(shù)據(jù)建立,對非白人族裔的預測效果較差。該論文的突破對于預防乳腺癌的種族平等尤為重要,數(shù)據(jù)顯示黑人女性罹患乳腺癌的機率比白人女性高40%,這可能由于不同族裔女性在檢測和獲得醫(yī)療保健方面的差異。
模型對不同族裔女性未來5年罹患乳腺癌的風險預測
研究人員成該深度學習模型在未來可以為乳腺X光檢查奠定基礎(chǔ),從而預測患者是否可能存在其他健康風險,如心血管疾病、胰腺癌等。他們希望這個模型能幫助更多人早發(fā)現(xiàn)、早預防、早治療,將癌癥風險扼殺于搖籃之中。
-
AI
+關(guān)注
關(guān)注
87文章
31536瀏覽量
270358 -
MIT
+關(guān)注
關(guān)注
3文章
253瀏覽量
23504 -
深度學習
+關(guān)注
關(guān)注
73文章
5516瀏覽量
121559
原文標題:女性的福音:MIT研究員最新AI模型可提前5年預測乳腺癌風險!
文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
英國將試用AI工具提前預測糖尿病風險
NVIDIA預測2025年AI行業(yè)發(fā)展
AI教父預測:超越人類智慧的AI或5年內(nèi)問世
AI編程工具會不會搶程序員飯碗
友思特應用 FantoVision邊緣計算:多模態(tài)傳感+AI算法=新型非接觸式醫(yī)療設(shè)備
![友思特應用 FantoVision邊緣計算:多模態(tài)傳感+<b class='flag-5'>AI</b>算法=新型非接觸式醫(yī)療設(shè)備](https://file1.elecfans.com/web2/M00/E6/B5/wKgaomZEgfSAaGtMAABqUJWuVbM448.png)
名單公布!【書籍評測活動NO.49】大模型啟示錄:一本AI應用百科全書
AI大模型的最新研究進展
“本源悟空”真機應用之量子人工智能領(lǐng)域——乳腺鉬靶檢測應用
![“本源悟空”真機應用之量子人工智能領(lǐng)域——<b class='flag-5'>乳腺</b>鉬靶檢測應用](https://file.elecfans.com/web2/M00/3F/9D/poYBAGJo-maAOH8MAAIB_hk2Mno583.png)
matlab預測模型有哪些
大模型時代,程序員當下如何應對 AI 的挑戰(zhàn)
![大<b class='flag-5'>模型</b>時代,程序<b class='flag-5'>員</b>當下如何應對 <b class='flag-5'>AI</b> 的挑戰(zhàn)](https://file1.elecfans.com//web2/M00/F6/06/wKgaomZ-ceeAU_ldAAYCIRbxQ_w529.png)
評論