9月14日,中科院遺傳所與聯想數據中心相關人員在北京舉辦了一場小型溝通會,希望在高性能計算領域,科研界與產業界能架起更為緊密的橋梁。
“我們的日常工作以計算為主,分析生物大數據,沒有高性能的計算機群來支撐的話,整個工作沒有辦法開展。”中科院遺傳所博士生導師梁承志如此介紹高性能計算對現代生物信息學研究的重要性。今年五月份,在國際著名學術刊物《Nature》上,梁承志課題組首次揭示了小麥A基因組序列精細圖譜,其實驗過程中涉及大量的生物數據計算分析。
聯想數據中心中國區方案營銷總監李煒表示,中國企業目前基本上可以補全高性能計算機硬件領域所有空白點,無論性能是否足夠好,國內已經可以做了。但是在軟件領域國內很多地方是空白,中國需要世界級工業軟件公司。
科研少不了自主高性能計算機
HPC是高性能計算機群的簡稱,是執行一般個人電腦無法處理的大資料量與高速運算的電腦,運算力更為強大的被稱之為超級計算機。氣候氣象、海洋、航空航天、生物、材料、高能物理、藥物、生命科學等領域的發展都少不了它,高性能計算機曾為天宮系列衛星路徑預測、國產大飛機C919精細數值模擬立下汗馬功勞。
梁承志在接受《每日經濟新聞》記者采訪時表示,2000年左右生物信息學科開始起步發展,呼喚更多研究人才。加之少年時代對于計算機的強烈興趣,自己所在的群體遺傳的分析又需要最新的方法、技術,最終選擇了遺傳學和生物信息的交叉領域。
1995年梁承志于中科院遺傳所獲得遺傳學博士學位,而在2001年,梁承志在加拿大Waterloo大學又獲得數學與計算機科學碩士學位。實現了從生物學到計算機科學的跨越,主要研究方向是基因組學和生物信息分析,這也成為梁承志學術生涯最重要的選擇之一。梁承志于《Nature》所刊發的文中,繪制了小麥A基因組序列精細圖譜,可以加速栽培小麥的遺傳改良和分子設計育種。
在研討會上,梁承志表示,生物大數據有著 “三高”的特征:高復雜性、高不確定性和高維度。這就導致了計算量的復雜,需要高性能計算機集群。如果沒有高性能集群支撐的話,對數據的分析是沒有辦法實現的,因為數據量太大,對存儲和計算都有很高的要求。
“以前我們做生物研究,相對來講實驗為主,做實驗過程漫長,花費很高,積累數據量有限。現在實驗能力提高了,十年前你要做實驗可能要花費一年,現在一個月或者一周,甚至一兩天就做完了。” 梁承志指出,現在我們得到了越來越多的數據,通過生物信息學的方法和分析過程,可以產生更多規律性的東西。
梁承志指出,隨著生物信息技術的爆發,高性能計算力的提升更為迫切。其同時指出,科研及其他高精尖技術研發的特殊性決定了安全性上的保證更為重要。
軟件應用需發力
在中科院遺傳所的一處小小的機房所在地,一位科研人員介紹,中科院和聯想合建的計算機集群,16年之間在這里不斷更換,更新到了現在第四代深騰8810。計算力也從當時的萬億次,提升了千萬億次,提升了千倍。
深騰8810高性能計算機系統
回顧歷史,我國高性能計算機確實實現了迅猛發展。1983年,我國“銀河Ⅰ號”的運算速度達每秒1億次,同時標志著我國巨型計算機研制成功。2002年8月,聯想研制成功了深騰1800超級計算機,實際運算速度超過萬億次。這是中國超算系統首次進入全球TOP500,排名第43位。
新華社報道,在2017年新一期的全球超級計算機500強榜單中,中國超算“神威·太湖之光”和“天河二號”連續第四次分列冠亞軍。
不過,“跑”得快、性能好的國產高性能計算機,在實現應用落地上仍需發力。李煒對《每日新聞記者》介紹,性能上我國產品已經足夠好,但國產的高性能集群應用領域比較窄,硬件之外,需要軟件層面的升級。
在高性能集群最早誕生的時候,最大的技術挑戰在于計算能力的損耗。李煒解釋,一個計算節點是兩萬億次,一百個節點是兩百萬億次,但計算的時候不能做到一加一等于二,會有能量的損耗。牛頓的能量轉化定律決定了,現實狀況下不可能實現理想狀態下的能量轉化的話,計算力轉化就有流失,這就要靠軟件。
梁承志對生物信息研究領域所面臨的瓶頸進行了介紹。其表示,生物數據復雜性的特點使得其對軟件的要求越來越高,目前很多軟件能力比較弱。市場上現在生物信息的軟件比十年前好太多了,但總的來講,生物信息學分成不同的小的領域,每個小的領域的軟件大家都是各做各的,還沒有真正的好的融合,這需要一個過程。梁承志這樣表達目前所遇到的阻礙,希望在HPC軟件應用生態上更為協同完善。
中國有華為、聯想等這些大的硬件企業,也有阿里巴巴、百度這樣的互聯網巨頭,現在中國更需要世界級的工業軟件公司。李煒指出,聯想當時做集群的時候,已經自己開發了集群調優并行軟件,特別是數學計算、遺傳、物理、氣象等領域里有專項團隊在做算法開發,努力保證集群效率做到更高。
華金證券在研究報告中指出,從高性能計算機應用機構來看,HPC 應用正在從政府、研究機構轉向商用,互聯網企業漸漸成為HPC 應用的主戰場。這主要得益于人工智能研發對高性能計算需求的增加,隨著互聯網、工業物聯網等新興負載的出現,有望改變高性能計算軟件應用的短板。
-
計算機
+關注
關注
19文章
7540瀏覽量
88646 -
人工智能
+關注
關注
1796文章
47683瀏覽量
240307 -
工業物聯網
+關注
關注
25文章
2384瀏覽量
64959
原文標題:高性能計算硬件世界領先,但我們更需要世界的級工業軟件
文章出處:【微信號:eetop-1,微信公眾號:EETOP】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論