電子發燒友網報道(文/周凱揚)轉眼接近六月,離新一期TOP500超算排名公布的日子又不遠了。這半年多時間里,業界在超算上的動作可不小,新的處理器、新的加速器都在積極加入各大超算中心、國家實驗室的大規模部署。國內的百億億級超算系統目前還沒有提交成績,不過這已經不重要了,這場誰先做到百億億級的競賽中國已經取勝了,更不用說去年就通過新一代神威超算打破了量子霸權。
不過近期有一種觀點開始冒頭,那就是超算的規模已經越來越大,結構也越來越復雜,未來除了CPU和GPU之外,FPGA、AI加速器、量子加速器、神經形態芯片和硅光芯片等設備是否會在超算上占據更大的份額呢?在這樣的異構體系下,超算是否會像其他大型儀器,比如大型粒子對撞機、平方公里陣列射電望遠鏡一樣,逐一替換部件呢?
開始異構化的超算
盡管FPGA已經經歷了多年的應用,但在HPC上亮相的次數可謂少之又少,這并非是缺乏嘗試,而是傳統FPGA硬件上存在限制,開發工具也相對特化,對于嘗試數據科學的開發者來說上手難度較高。
VersalHBM /Xilinx
然而近年來,在各大FPGA廠商的努力下,FPGA已經有了長足的發展,其性能足以支撐起HPC應用的運行,FPGA編程也終于有了軟件開發而不是硬件設計的樣子。英國的ExCALIBUR項目就開始利用FPGA作為HPC應用的測試平臺,所用硬件有Xilinx的Alveo、Versal,也有英特爾的Stratix-10。
神經形態芯片也想要取代GPU的位置,美國桑迪亞國家實驗室就利用了5000萬片英特爾的Loihi神經形態芯片進行了研究,證明了這類芯片不僅僅適用于解決AI上的挑戰,在分子模擬、生物學建模這些超算應用也能做到極高的能效比。
即便如此,我們在TOP500上看到利用新硬件的情況還是很少,英特爾、AMD和英偉達還是占據了絕對的主導。
實際應用與軟件移植的痛點
但說到頭來,TOP500所奉行的HPL測試標準并不是衡量超算性能的唯一標準,還有專注于帶寬的HPCG,以及更看重時延的Graph500。異構超算可以借助不同硬件的特性,將這些痛點各個擊破。
富岳超級計算機 / 日本理化學研究所
日本富岳超算的主要貢獻者之一,前不久剛獲得了日本政府所頒發紫綬褒章的松岡聰卻對超算上的異構趨勢表示了一定的懷疑。他認為未來的HPC系統不會由各種類型的設備組成,反倒是會更加慎重地選擇所用的處理器,從而兼顧計算、帶寬和時延的需求。
原因很簡單,那就是軟件生態。如今的HPC代碼運行著世界上最復雜的應用,比如氣象預測、大規模數字孿生等等。但這類應用由于復雜程度之高,承擔不起因為當前的硬件架構幾年內過時而面臨著重新編程或淘汰的代價,這也就是為何CPU+GPU的配置在超算領域依舊是龍頭老大,因為這種架構下的超算軟件生態已經成熟,可以沿用下去。
就拿常見的超算編程語言Fortran為例,雖說這一語言在數學運算上有著很大的優勢,但由于維護和移植困難,不少開發者都轉向了C/C++,而GPU又多用C++,所以即便現在各種加速器頻出,率先使用他們的也只是數據中心或AI等場景,并非超算。
但松岡聰也表示,他并不是指這些設備無法運行這些代碼,或者移植困難不代表沒有嘗試的價值,而是即便代碼可以運行在這些設備上,也很難通過負載均衡來踐行古斯塔夫森定律,即處理器數量增加可以讓程序運行時間減少,最好的解決思路還是CPU或CPU+GPU這種同構的方案。
雖然其他硬件加入的異構確實對不同的工作流各個攻破,但超算很多時候是建好就完事的計算系統,后續也許只能增加同樣的計算資源來提高硬件性能,設計者無法預先判斷未來要運行的任務,因此追求這樣的靈活性還不如使用同構這一通解。
在使用超算的研究者和科學家看來,他們在一臺超算上力求取得最大性能就已經付出了巨大的心力,要是超算內真的囊括一堆不同架構的設備,單是龐大的編程和移植工作量就足以讓他們喪失興趣。他們或許更愿意去優化算法或理論,都不愿意因為架構的變化而去花費大量時間編程。
云化超算成為可行方案?
還有一種觀點也獲得了不少支持,那就是云化超算。云服務廠商在HPC上的努力也都有目共睹,去年超算大會上,國內外大學之間的比賽也是在云服務上構筑超算系統,TOP500上來自云服務廠商的超算也有幾臺,微軟的Azure就有5臺,最強的一臺Voyager-EUS2甚至排到了第十的高位。
雖然云端部署超算的成本同樣巨大,但對于一些實驗室來說,云端的模塊化特性讓他們不用擔心自己用不到什么組件,花更少的時間來購置超級計算機,花更多的時間去使用它。比如英國政府就選擇在微軟的Azure上部署慧與的CrayEX超算,用其完成氣象預測工作。更方便的是,由于超算消耗電力巨大,基礎設施可以托管在北歐等清潔能源更多的地方。
-
處理器
+關注
關注
68文章
19407瀏覽量
231180 -
cpu
+關注
關注
68文章
10902瀏覽量
213000 -
超級計算機
+關注
關注
2文章
464瀏覽量
42028
發布評論請先 登錄
相關推薦
評論