吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

輕騎逐單于,大雪滿弓刀:華為分布式存儲的一騎絕塵

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2023-06-12 09:37 ? 次閱讀

唐代詩人盧綸,有一首膾炙人口的《和張仆射塞下曲》,“月黑雁飛高,單于夜遁逃。欲將輕騎逐,大雪滿弓刀。”詩中的慷慨激昂,熱血炙烈,千年來讓無數國人心魂激蕩。

時代變遷,歲月遷移,今天我們所期望聽到的熱血故事或許不在現實世界,而是在數字山野的輕騎追逐中,在核心科技的發展競賽里。

《數字中國建設整體布局規劃》中,明確提出了構筑自立自強的數字技術創新體系,為關鍵核心技術突破發展指明了方向。在核心科技自立自強中,越來越多的“欲將輕騎逐,大雪滿弓刀”的故事正上演著。

wKgZomSEbCKAMpY4AAJcynxK8qA142.jpg

5月24日,在德國漢堡舉辦的ISC 2023(國際超算大會)期間,更新了最新一期的IO500榜單,這是國際最權威的存儲性能排行榜。在IO500極為重要的10節點榜單中,華為OceanStor Pacific分布式存儲全面刷新了世界紀錄。尤其驚人的是,華為OceanStor Pacific的總得分超過了13萬分,是上屆冠軍得分的15倍之多。

在世界紀錄背后,在華為OceanStor Pacific分布式存儲霸榜背后,蘊藏著存儲鎮守數字經濟大國重器的支柱意義,也蘊藏著中國存儲從跟隨走向領先的全球化趨勢。

一紙榜單背后,是一份對數字山河的守候,是一場輕騎絕塵的突圍。

數字時代,半壁江山

想要講清這個故事,首先需要了解一個背景:HPDA為什么重要?以及面向HPDA場景的分布式存儲為什么價值非凡?

首先HPDA是由HPC(High Performance Computing高性能計算)發展而來。HPC是一種數據分析的應用場景。其通過聚合大量的計算和存儲單元對數據進行分析,從而解決復雜問題。從基因測序到芯片制造,從油氣勘探到航空航天,再到我們生活中的天氣預報、影視特效渲染,都離不開HPC作為計算底座。

總之一句話,HPC是現代社會發展的計算基石。所以有人笑稱,《三體》里的外星人要想遏制人類科技,其實不用那么麻煩,不讓人類用HPC就行了。

隨著HPC性能與技術的不斷進步,人類能夠在固定時間內分析更多數據,與之相伴的,我們也會保存更多數據給HPC場景,用來挖掘數據背后的價值。

隨著相關數據量的指數級增長,HPC領域逐漸認識到提升數據分析能力、革新數據分析機制的重要性。將AI、大數據等技術分析手段與HPC結合,是更高效實現數據價值的新形式,即HPC、AI、大數據融合而成的 HPDA(High Performance Data Analytics)。

根據相關數據,2017 到 2023 年間,HPDA類應用的年增長速度達到了15.4%,HPC-based AI 類應用的年化增速更將達到 29.5%,遠高于傳統HPC的7.8%。由于HPDA事關國計民生,與國家的科技創新能力、科技自立自強水平緊密相關,HPDA已在全球范圍內被認為是未來科技發展的戰略高地,被稱為占據數字時代的半壁江山。

一項技術的快速增長,往往會給配套設施帶來挑戰。HPDA的快速發展,就給存儲產業帶來了巨大的升級需求。隨著數據量從PB級向EB級演進,存儲成本日益增高。高性能計算量的持續增加,以及大數據、AI能力的加入,又對海量數據的多次提取、流轉、讀寫、存儲能力提出了更高的要求。

因此面向HPDA的分布式存儲,正在承載越來越多的目光和聲量。有人認為,誰掌握了HPDA存儲,誰就能掌握尖端科研的未來。

但現實情況是,中國在發展適配HPDA場景的分布式存儲過程中,正遇到一系列問題。

比如說,中國目前仍然有75%的數據存納于機械硬盤之中。相對于閃存盤,機械硬盤容量密度低,數據讀取慢,能耗高,可靠性差。相對來說,閃存介質幾乎沒有缺陷,尤其更適合HPDA場景這種對性能與時延異常敏感的工作負載。

在目前階段,“磁退硅進”已經成為存儲產業發展的核心趨勢。比如全國人大代表、華中科技大學計算機科學與技術學院院長馮丹教授就提出,需要加快發展中國技術創新的,以半導體全閃存技術為核心的下一代存儲技術標準體系。為此,要抓住全球存儲介質升級、存儲架構跨代演進窗口期,盡快完善中國自身的數據存儲、數據保護、安全評測等關鍵標準體系建設。

在各個企業級存儲相關領域中,以HPC、HPDA場景為代表的分布式存儲全閃存替換任務更加急迫。好在,華為分布式存儲已經開始行動,推進面向全閃存的一系列改造。比如說,本次IO500霸榜的華為OceanStor Pacific分布式存儲,就是采用了全閃存機型。未來分布式存儲的全閃化已經是確定性的產業走向,面向這個趨勢,從產業側到應用側都應該加速分布式全閃的替換進程。

一件毋庸置疑的事就是,即便前路漫長,中國分布式存儲全閃存替換是大勢所趨,發展全閃分布式存儲已經刻不容緩。

再者,適配高性能計算的Lustre分布式文件系統已經明顯落后。Lustre 1.0早在2003年發布,隨后得到了一系列歐美IT企業與美國能源部的認可,逐漸形成了談起HPC,就無法繞開Lustre的局面。但事實上,Lustre在適配HPDA的過程中已經展現出了架構落后、磁盤碎片化問題嚴重、性能瓶頸明顯、安全能力不足等短板。

在受目前外部環境未知的干擾下,對于存儲這樣承載著科技明珠HPDA的關鍵基礎設施,逐漸實現自主可控也是當務之急。

綜合來看,占據數字時代半壁江山的HPDA,亟需自主創新、實力絕群的存儲力量來加持。

十分幸運的是,它來了,伴著“地表最強”的稱號走來了。

定海神針,霸榜之路

IO500是HPC領域最具影響力的世界級存儲排行榜,被稱為“存儲界的諾貝爾”。其主要針對存儲系統的性能進行評測與排名,綜合考察了帶寬性能(GiB/s)和元數據性能(kIOP/ s)兩大部分。其中10節點榜單統一了計算規模,把基準性能測試的計算節點限制至10個,能夠更全面、更準確地反映出存儲在日常應用中的實際表現,備受全球HPDA領域用戶關注。

綜合來看,IO500在目前階段就是最具公允性與說服力的存儲性能榜單。一方面,經過多年發展,其頒布結果和行業價值已經得到了全球數字化產業的承認。另一方面,IO500榜單的測試非??陀^、科學,其提供了嚴苛的標準化性能測試套件,確保結果可信。值得一提的是,IO500榜單有著公允的測試人員配置與學術監督機制,避免了不少榜單受地緣因素影響,惡意打壓他國產品技術等現象。

wKgZomSEbCOAextJAACQJ07t73M038.jpg

在這樣的存儲領域最高舞臺上,華為OceanStor Pacific分布式存儲以一騎絕塵的姿態,完美刷新了紀錄。其通過模擬不同的I/O應用模型,歷經12項苛刻的場景測試,整體達到了2400 GiB/s的帶寬與770萬 kIOP/ s的元數據性能。打破IO500紀錄十數倍的霸榜行為背后,可以仰望到華為OceanStor Pacific的技術成果在業界鑄就了又一座豐碑。這座豐碑像一枚定海神針,在數字山河蕩氣回腸。

十年磨一劍,一朝試鋒芒。成功霸榜之前,華為分布式存儲已經用了十年時間深耕細作,累積深厚技術,不斷創新。從這次IO500總覽星圖中就可以看到,從總體得分、帶寬性能、元數據性能等五個維度來看,華為OceanStor Pacific全面實現了“五邊形戰士”的成就,沒有一處短板,沒留下任何空缺。難怪有人說,這次IO500出爐,讓全球看到了華為存儲藏不住的王者實力,看到了中國存儲崛起的必然性。

wKgaomSEbCSAFifYAACnvLqVlvg914.jpg

快馬加鞭,實力斐然

那么我們自然有必要刨根問底,看看華為OceanStor Pacific究竟是如何實現這些成績的?

俗話說,天下武功,唯快不破,對于存儲來說也是如此,快就意味著性能優勢,意味著提升了HPDA的工作效率與數據分析能力。為了追求這個快,華為采取了不斷精進的四層加速架構,這也被稱為華為存儲獨有的“多維度加速”體系:

1.應用加速:面向HPDA為代表的數據密集型應用,華為分布式存儲業界唯一的應用感知DataTurbo加速引擎,通過融合數據格式、近數據處理和特征處理算子卸載加速等技術,實現了HPDA生態應用性能的倍增,提升了應用處理效率。

尤其針對HPDA愈發密集、愈發不可或缺的大數據環節,華為統一了數據湖和數倉內的文件格式,并優化了元數據結構,創新性地在存儲側為計算引擎開啟緩存能力,實現了效率60倍的提升,讓數百PB數據的查詢時間縮減至10秒。

2. 算法加速:通過獨創的SmartBalance全均衡設計,華為可以實現對數據類型和I/O流的智能感知,從而能夠提升HPDA業務混合負載的處理效率。這不僅兼顧了CPU算力不足或調用堆棧深度等軟件問題引起的IOPS瓶頸,更解決了HPC多流程跨系統的數據遷移、數據膨脹問題。

3.網存加速:華為OceanStor Pacific通過自主創新的網絡芯片支持RoCE,同時支持RDMA和IP的訪問能力。在同時支持帶寬、IOPS等不同類型的業務時,可以智能調整網絡的相關參數,大幅降低不同存儲節點間的數據交換時延。

4.架構加速:與陳舊的Lustre開源分布式文件系統架構相比,華為分布式存儲帶來了全對稱式分布式架構。據測評,Lustre的非對稱設計會導致在7對MDS時出現性能瓶頸,并且網元部件眾多而導致IO路徑漫長。與此不同的是,華為OceanStor Pacific的全對稱架構打破了元數據瓶頸,性能可以隨容量實現絕對的線性增長。

此外,與Lustre對負載的單一路徑讀寫、覆蓋寫模式不同,華為OceanStor Pacific采用智能IO路徑選擇與Append-Only模式,避免長時間運行導致的磁盤碎片化問題,實現動態混合IOPS性能提升20%。

不僅如此,相比Lustre自身無冗余保護,純粹依賴底層SAN陣列的RAID保護的安全模式,華為OceanStor Pacific憑借軟硬一體的穩定深度可信協同,滿足跨節點冗余保護,支持最大4節點故障業務不中斷。

通過四大維度的全面技術創新,華為實現了分布式存儲的“快馬還需一鞭”,比想象中更快一步。這些技術創新點的疊加產生了一種化學反應,讓華為OceanStor Pacific的性能遠超業界競品,做到了這樣一句武俠小說里的形容——真正的強大,是沒有對手的。

龍城飛將,家國守候

與大家想象的不同,華為分布式存儲并非遠在天邊,其所帶來的價值就在我們的城市中,就在我們的生活里,就在科技自立自強的披星戴月中。

比如說,山東的朋友應該都對濟南超算非常了解。國家超級計算濟南中心,是科技部批準成立的千萬億次國際超級計算中心之一,目的是為打造超級計算的高性能數據分析HPDA平臺,從而支撐學術攻堅,賦能透明海洋、類腦計劃、基因組學、人工智能、新藥創新等領域的大科學計劃、大科學工程的實施。

這樣一個重要的平臺,在存儲資源搭建過程中卻也遇到了一系列問題。比如說以文件存儲為主的HPC平臺、AI平臺,與以對象存儲為主的云平臺,存在嚴重的數據孤島,最大的難題是不同平臺間的數據流動。并且,存儲資源的相互搶占,會導致原本充沛的算力無法發揮,整體系統效率不高。

峰回路轉,華為OceanStor Pacific分布式存儲有效地解決了這些問題。通過結合數據流動軟件,華為分布式存儲幫助濟南超算打造了超算領域首個最大規模的數據流動平臺,其可支持打通數據流動,促進數據跨域創新,助力濟南超算中心打造數據密集型超算。在我們為濟南超算、中國超算自豪時,似乎也應該記得軍功章有華為OceanStor Pacific的一份。

華西醫院,是四川朋友非常了解的一家醫療機構。除了強大的醫療能力,華西還肩負著科研探索、引領西南地區生物醫藥事業發展的重任。其中,華西生物醫學大數據中心是華西醫院的健康醫療大數據研究與應用開放共享平臺,其推進的大規模全基因組分析,以及臨床成果轉化,是華西生物醫學大數據中心的重要探索方向。

想要滿足華西在基因領域的數據存用,也有著一系列挑戰?;驕y序產生的數據容量普遍達到了TB級別,對數據存儲提出了挑戰。華為OceanStor Pacific分布式存儲,為華西醫院提供了更高性能的存儲底座,實現了200倍存儲性能提升,全基因組分析流程時間從傳統的24小時縮短到了7分鐘。

都說21世紀是基因的世紀,在認識我們自己前,首先需要妥善的存儲作為探秘基因工程的起點,華為OceanStor Pacific分布式存儲再次守護成功。

由此不難看出,華為OceanStor Pacific既是數字中國的守護者,也是數字中國的加速器。它默默守護著科技創新、前沿探索,幫助每一座城市在超算的時代里熠熠生輝。

wKgaomSEbCWAIKSoAAWjRWc28wU441.jpg

目前階段,華為分布式存儲在歐洲、中東、拉美和亞太的關鍵業務場景均實現了大規模突破,達到了2022年全球二級存儲收入排名第二的成績,在總份額中占比25%,并保持著18%的增速。從國內來看,華為分布式存儲連續六年市場第一,占比高達48.2%,同時在海外,華為分布式存儲也受到廣泛認可,份額達到25%,在文件與對象存儲上的收入增速高達50.8%。

未來,我們應該會看到華為存儲出現在更多的榜單上,欲將輕騎逐,大雪滿弓刀,越來越多的數據中心、實驗室、工廠、農田里,將上演以存儲定未來的故事。

尤其在這個時代,華為OceanStor Pacific折桂IO500還有一重獨特的意味。這重意味,可以用一句邊塞詩來表達:但使龍城飛將在,不教胡馬度陰山。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 華為
    +關注

    關注

    216

    文章

    34532

    瀏覽量

    252993
  • 存儲
    +關注

    關注

    13

    文章

    4353

    瀏覽量

    86169
  • 數字技術
    +關注

    關注

    0

    文章

    334

    瀏覽量

    25406
  • 分布式存儲
    +關注

    關注

    4

    文章

    172

    瀏覽量

    19577
  • 超算
    +關注

    關注

    1

    文章

    115

    瀏覽量

    9134
收藏 人收藏

    評論

    相關推薦

    分布式云化數據庫有哪些類型

    分布式云化數據庫有哪些類型?分布式云化數據庫主要類型包括:關系型分布式數據庫、非關系型分布式數據庫、新SQL分布式數據庫、以列方式
    的頭像 發表于 01-15 09:43 ?111次閱讀

    WDS分布式存儲系統軟件助力電信工程海量數據存儲項目

    WDS分布式存儲系統軟件助力電信工程海量數據存儲項目
    的頭像 發表于 11-11 09:59 ?245次閱讀
    WDS<b class='flag-5'>分布式</b><b class='flag-5'>存儲</b>系統軟件助力電信工程海量數據<b class='flag-5'>存儲</b>項目

    某證券公司智能云投資交易云集群高性能分布式存儲應用

    某證券公司智能云投資交易云集群高性能分布式存儲應用
    的頭像 發表于 09-27 09:57 ?315次閱讀
    某證券公司智能云投資交易云集群高性能<b class='flag-5'>分布式</b><b class='flag-5'>存儲</b>應用

    分布式存儲費用高嗎?大概需要多少錢

    分布式存儲的費用是否高,取決于多個因素,包括存儲容量、性能要求、服務提供商、計費模式等。因此,無法簡單地給出個“高”或“不高”的答案。通常分布式
    的頭像 發表于 09-24 10:41 ?321次閱讀

    云計算廠家使用WDS分布式存儲構建其高性能超融合體機

    云計算廠家使用WDS分布式存儲構建其高性能超融合體機
    的頭像 發表于 09-23 09:57 ?310次閱讀
    云計算廠家使用WDS<b class='flag-5'>分布式</b><b class='flag-5'>存儲</b>構建其高性能超融合<b class='flag-5'>一</b>體機

    基于分布式存儲系統醫療影像數據存儲解決方案

    基于分布式存儲系統醫療影像數據存儲解決方案
    的頭像 發表于 09-14 09:53 ?380次閱讀
    基于<b class='flag-5'>分布式</b><b class='flag-5'>存儲</b>系統醫療影像數據<b class='flag-5'>存儲</b>解決方案

    基于分布式對象存儲WDS的信托非結構化數據整合平臺

    基于分布式對象存儲WDS的信托非結構化數據整合平臺
    的頭像 發表于 08-28 09:56 ?409次閱讀
    基于<b class='flag-5'>分布式</b>對象<b class='flag-5'>存儲</b>WDS的信托非結構化數據整合平臺

    醫療PACS影像數據的極速分布式存儲解決方案

    醫療PACS影像數據的極速分布式存儲解決方案
    的頭像 發表于 08-23 10:13 ?407次閱讀
    醫療PACS影像數據的極速<b class='flag-5'>分布式</b>塊<b class='flag-5'>存儲</b>解決方案

    基于分布式存儲WDS的金融信創云承載數據庫類關鍵應用

    基于分布式存儲WDS的金融信創云承載數據庫類關鍵應用
    的頭像 發表于 08-16 09:42 ?323次閱讀
    基于<b class='flag-5'>分布式</b><b class='flag-5'>存儲</b>WDS的金融信創云承載數據庫類關鍵應用

    基于WDS的保險公司極速分布式存儲建設高速混合云方案

    基于WDS的保險公司極速分布式存儲建設高速混合云方案
    的頭像 發表于 07-08 09:52 ?364次閱讀
    基于WDS的保險公司極速<b class='flag-5'>分布式</b><b class='flag-5'>存儲</b>建設高速混合云方案

    黑龍江電力高性能WDS分布式存儲系統解決方案

    黑龍江電力高性能WDS分布式存儲系統解決方案
    的頭像 發表于 07-01 09:54 ?430次閱讀
    黑龍江電力高性能WDS<b class='flag-5'>分布式</b><b class='flag-5'>存儲</b>系統解決方案

    面向企業關鍵業務場景的分布式存儲軟件ExponTech WDS

    面向企業關鍵業務場景的分布式存儲軟件ExponTech WDS
    的頭像 發表于 06-05 09:41 ?378次閱讀
    面向企業關鍵業務場景的<b class='flag-5'>分布式</b><b class='flag-5'>存儲</b>軟件ExponTech WDS

    華為分布式存儲連續三年榮膺2024年Gartner“客戶之選”

    近日,全球權威咨詢與分析機構Gartner發布《2024年Gartner Peer InsightsTM 分布式文件系統與對象存儲“客戶之聲”》報告,華為憑借其OceanStor分布式
    的頭像 發表于 05-24 10:12 ?762次閱讀

    浪潮信息發布AS13000G7-N系列分布式全閃存儲

    浪潮信息近日推出了專為大型AI模型優化的AS13000G7-N系列分布式全閃存儲。該系列基于浪潮信息自研的分布式文件系統,結合新代數據加速引擎DataTurbo,為用戶提供卓越的
    的頭像 發表于 05-14 10:03 ?621次閱讀

    分布式存儲與計算:大數據時代的解決方案

    分布式存儲和計算技術應運而生,并迅速成為處理大數據的首選方案。本文將深入探討分布式存儲和計算的概念、優勢及其在各個領域的應用情況。 1.分布式
    的頭像 發表于 03-07 14:42 ?862次閱讀
    大发888注册网址| 澳门百家乐官网游戏| 百家乐怎么才会赢| 百家乐庄牌| 百家乐官网赌博机有鬼吗| 做生意门口禁忌| 娱乐城注册送18元| 伯爵百家乐娱乐城| 澳门百家乐官网技巧| 明升国际网| 百家乐试玩| 百家乐游戏规则介绍| 百家乐官网解析| 赌球网站| 乐天百家乐的玩法技巧和规则 | 百家乐技巧运气| 百家乐官网押注最高是多少| 澳门百家乐官网常赢打法| 易发百家乐| 顶级赌场真假的微博| 新澳博百家乐的玩法技巧和规则| 百家乐官网娱乐网网77scs| 百家乐官网北京| 玩百家乐官网的高手| 百家乐官网赌场怎么玩| r百家乐官网娱乐下载| 至尊百家乐官网20111110| 百家乐官网技巧娱乐博彩| 大厂| 国际环球娱乐| 百家乐官网园棋牌| 百家乐官网真人玩下载| 百家乐官网77scs| 百家乐的方法和公式| 缅甸百家乐娱乐| 百家乐注码调整| 真人百家乐官网赌博技巧| 新彩百家乐官网的玩法技巧和规则 | 百家乐官网生活馆拖鞋| 百家乐官网单人操作扫描道具| 怎样玩百家乐官网才能|