北京2022年6月17日 /美通社/ -- 進入數字經濟時代,算力將為核心生產力。2022年開年, “東數西算”工程正式全面啟動,通過構建數據中心、云計算、大數據一體化的新型算力網絡體系,將東部密集地區(qū)的算力需求有序引導到西部,使數據要素跨域流動,優(yōu)化數據中心建設布局,在緩解東部能源緊張問題的同時,給西部發(fā)展開辟新路。
"東數"如何"西算"
截至目前,中國數據中心規(guī)模已達500萬標準機架,算力達到130eflops(每秒一萬三千億億次浮點運算),預計每年仍將以20%以上的速度快速增長。"東數西算"工程誕生的主要背景是為了解決東部地區(qū)土地、能源等資源日趨緊張,大規(guī)模發(fā)展數據中心難以為繼的問題。西部地區(qū)在資源、電力、自然條件等方面有更多優(yōu)勢,具備發(fā)展數據中心,承接東部算力需求的潛力。
但是,并不是所有的數據都不加區(qū)別地拿到西部,西部數據中心主要承擔后臺加工、離線分析、存儲備份等對網絡要求不高的業(yè)務。而像工業(yè)互聯網、金融證券、災害預警、遠程醫(yī)療、視頻通話、人工智能推理等對網絡要求較高的業(yè)務則依然留在東部數據中心處理。
因此,"東數西算"工程首先在京津冀、長三角、粵港澳大灣區(qū)、成渝、內蒙古、貴州、甘肅、寧夏等8地啟動建設國家算力樞紐節(jié)點。依托這8個算力樞紐,集中政策和資源,著力優(yōu)化網絡、能源等配套保障,更好引導數據中心集約化、規(guī)模化、綠色化發(fā)展,促進東西部數據流通、價值傳遞,帶動數據中心相關產業(yè)由東向西有效轉移。
在8個算力樞紐內,還進一步規(guī)劃了10個國家數據中心集群。每個集群是一片物理連續(xù)的行政區(qū)域,具體承載算力樞紐內的大型、超大型數據中心建設,從而有效減少數據繞轉時延,降低長途傳輸費用,保障數據中心能源供給,積極協(xié)調安排能耗指標。
"東數西算"帶來的數據跨地域交互的難題
從本質上來看,"東數西算"工程就是要打造一個存、算、用分離的算力基礎平臺,實現對數據的分類治理 -- 把服務后臺加工、存儲災備、離線分析、存儲備份等對網絡時延要求不高的"冷數據",優(yōu)先向貴州、內蒙古、甘肅、寧夏節(jié)點轉移;與此相應,對網絡時延要求高的"熱數據",部署在東部。
分流之后,數據實現大規(guī)模集約化,隨之而來的是數據傳輸和計算在不同地區(qū)遠程化問題,對數據基礎設施和通信基礎設施提出了更高要求。數據在多個數據中心之間的有效流通需要多協(xié)議的統(tǒng)一支持;從數據采集、存儲、到流通、交換、共享、使用等全生命周期的安全風險也存在巨大挑戰(zhàn);從大量非結構化文本里通過自然語言處理,把數據提取出來,變成結構化數據,對存儲智能化的要求也越來越高;而綠色、節(jié)能也是建設數據中心無法繞過的一個問題。
浪潮新存儲之道 迎接"東數西算"時代
浪潮基于存儲平臺戰(zhàn)略,全面升級集中式存儲、分布式存儲、備份和歸檔存儲等平臺型產品并推出四種標準方案,助力用戶強化數據基礎設施,應對新變化。
浪潮存儲四種標準方案包括基于數據生命周期的數據管理方案、針對科研、人工智能等非結構化數據的融合存儲方案、針對數據庫類應用的結構化數據存儲與容災方案以及基于云化轉型的云化基礎設施方案。
浪潮存儲基于對數據需求特點的研究,發(fā)現數據在產生、采集之后不同時期的數據存在不同的意義,對于存儲的性能、成本的需求差異較大,基于這些特點提出了熱、溫、冷、冰四級分層數據生命周期管理策略,根據數據的訪問頻率,集中式存儲承載客戶的在線業(yè)務熱數據,備份存儲平臺一方面采用副本保護溫數據,另一方面可以通過CDM(Copy Data Management,數據副本管理)特性對副本快速拉起上線,歸檔存儲平臺和帶庫、藍光庫的組合來承載客戶長生命周期、低訪問頻率數據的數據存儲業(yè)務,通過數據分級集中管理,實現存儲性能、容量和成本之間的平衡,提升系統(tǒng)的整體存儲性能的同時,減少設備投入成本。同時方案還提供從云端、第三方存儲設備的數據遷移服務,幫助客戶更好的實現數據的流轉。
結構化數據存儲與容災方案除了成熟的雙活、兩地三中心技術能夠保障關鍵業(yè)務保持連續(xù)之外,還可以通過備份一體機和集中式存儲的云備份功能,可以在本地、多地、云上、云下建立多個數據副本,保證數據永不丟失,獨有的網絡加速技術,通過先進的算法,僅占用少量的網絡帶寬就可以完成海量數據的跨數據中心的東西部的遠程復制,大幅降低客戶對容災網絡帶寬的依賴,節(jié)約成本。
非結構化數據融合存儲方案主要適用于教育及研究機構來解決海量非結構化的數據存儲、分析,以及數據流動問題;利用統(tǒng)一資源池支持文件、對象、大數據的非結構化數據,通過語義零損、協(xié)議互通,實現從語義到協(xié)議的充分融合。根據操作頻度,數據被自動分配到高速的SSD和低速的HDD介質中,實現介質融合,在不同速度的介質中自由流動,實現分級融合。
面向多云環(huán)境場景的云化基礎設施方案是基于浪潮存儲與云廠及云集成商的合作積累,實現與云場景主流廠商的全面兼容,對云場景下的各種協(xié)議、插件,以及中間件可以全面對接,面向云廠和合作伙伴開放Restful API、SMI-s等接口對應的管理和控制信息,在新興場景進行場景定制,提供更豐富的功能特性。
浪潮存儲四大存儲平臺產品通過技術創(chuàng)新保障了方案的高效、可靠、節(jié)能,面向東數西算等場景提供數據存儲管理服務,釋放數據價值。
在高效方面,浪潮存儲基于iTurbo2.0智能加速引擎,通過智能IO感知、智能快路徑、智能資源調度、智能數據組織等四大技術,實現從集中式、分布式、總榜在SPC-1國際基準性能測試中多次刷新世界紀錄,通過數據縮減可以最高實現5:1的空間節(jié)省,智能運維可以對存儲設備進行集中智能管理,對容量、性能、故障進行預測,大大降低了運維成本,提升了管理效率。
在安全可靠方面,浪潮存儲從部件、器件、整機系統(tǒng)、核心軟件、管理軟件到解決方案,用六重保護確保數據安全可用。如在部件層面,則圍繞應用場景,結合IO讀寫特點,定制硬盤、SSD等部件。
在綠色節(jié)能方面,浪潮存儲一直在經濟節(jié)能方面探索和創(chuàng)新,早在2019年就提出新數據時代前瞻洞察,推出了自研NVMe SSD及"綠色節(jié)能和性能兼?zhèn)?quot;的全閃存儲。浪潮全閃存儲基于 "iTurbo 2.0智能加速引擎",構建了由不能性能閃存盤組成的智能分層的存儲資源池,通過軟硬聯合調優(yōu)大幅提升了存儲性能并降低了空間占用和能源消耗,數據生命周期管理方案也通過磁帶庫將冰數據進行離線歸檔,減少了設備運行的能耗,達到節(jié)能的效果。
"東數西算"工程剛剛拉開帷幕,充滿了機遇和挑戰(zhàn),面向未來,浪潮存儲將基于存儲平臺戰(zhàn)略提供集中式存儲、分布式存儲、備份和歸檔存儲四大平臺型產品及場景方案,打造安全、可靠、經濟、高效的數據基礎設施,助力"東數西算"工程發(fā)展。