北京2023年7月20日 /美通社/ -- 這是一次具有開創(chuàng)性和引領(lǐng)性意義的測試!
測試的主角是浪潮云海OS,其典型性表現(xiàn)在,完成了全球唯一面向"一云多芯"場景的SPEC Cloud基準(zhǔn)測試,并在三種處理器節(jié)點混合部署集群測試中,相對可擴展性、平均實例配置時間等指標(biāo)均達到全球領(lǐng)先水平,驗證了云海OS在業(yè)務(wù)應(yīng)用跨處理器架構(gòu)場景下的高效率、高性能和高擴展能力。此次測試的意義不僅僅在于又一次彰顯了浪潮云海OS的強大,更可以理解為它創(chuàng)建了以"一云多芯"為核心的云平臺參考基準(zhǔn)。
此次測試雖然是一個廠商的個性化行為,但是背后折射出的是云計算產(chǎn)業(yè)的又一次演進。"一云多芯"不僅是解決多元計算底層異構(gòu)化,以及生態(tài)離散的根本性解決方案,而且也是當(dāng)下及未來云平臺必備的核心能力之一。
"一云多芯"是剛需
你可能早就注意到了,包括亞馬遜云科技、BAT在內(nèi)的國內(nèi)外Top級的云服務(wù)商都紛紛推出了自研芯片。造成這一局面的最直接的驅(qū)動因素就是由新一輪AI浪潮帶來的算力爆發(fā)。實際上,AI引發(fā)的算力之爭還只是冰山一角,"海平面之下"隱藏更深的是多元計算對硬件架構(gòu)、軟件平臺甚至上層應(yīng)用帶來的挑戰(zhàn)。
多元計算市場的形成是從底層芯片開始的。眾所周知,基于不同的芯片,能夠構(gòu)建出形形色色的服務(wù)器整機,在這之上還有操作系統(tǒng)、中間件、數(shù)據(jù)庫,乃至各種各樣的應(yīng)用軟件。這些軟硬件系統(tǒng)無一例外要對底層芯片進行適配,當(dāng)算力的種類、規(guī)模呈線性增加時,這無論對于IT廠商還是行業(yè)用戶來說都是一件最頭痛的事。
作為軟件開發(fā)商,是不是每開發(fā)一個軟件,都要去適配不同的芯片?作為用戶,到底是采購一種芯片還是多種芯片?結(jié)果是左右為難,無所適從!以前,無論是私有云還是公有云,主要都是以適配一種最主流的芯片為主。但是多元計算興起之后,適配不同的芯片不僅是技術(shù)上的選擇,更是商業(yè)上的抉擇。因為如果只支持一種芯片,那么用戶就沒有第二種選擇,隨之而來的風(fēng)險也就不可避免。
解決底層芯片異構(gòu)的問題,不同的廠商會從不同的維度、層面切入,浪潮云海選擇站在更高一層,即云操作系統(tǒng)的層面,以"一云多芯"來破解這一棘手的問題。脫胎于"硬件重構(gòu)、軟件定義",將云與底層硬件完全解耦,以一朵云適配不同的芯片,這就是"一云多芯"的本質(zhì)。"對于浪潮云海來說,‘一云多芯'并不是一種高級能力,而是一種基礎(chǔ)能力。只要購買了支持‘一云多芯'的浪潮云海OS,用戶不必考慮底層用的是哪種芯片,這朵云能夠從容應(yīng)對上層所有的業(yè)務(wù)與應(yīng)用問題。"浪潮數(shù)據(jù)云計算方案總監(jiān)劉健如是說。
上述從架構(gòu)和應(yīng)用的角度分析了"一云多芯"的成因,下面我們要從更深層次的生態(tài)角度去剖析"一云多芯"帶來的變革。
回顧IT的發(fā)展歷程,在打破了小機垂直封閉的生態(tài)之后,IT生態(tài)就是分層級的,做芯片的、做整機的、做操作系統(tǒng)的,大家各司其職,業(yè)內(nèi)基本很難見到有誰一家獨大,能夠從應(yīng)用到底層芯片通吃??紤]到可持續(xù)發(fā)展和安全性的問題,應(yīng)該沒有哪個用戶愿意把全部身家,孤注一擲投入到某一個當(dāng)前看上去還挺好的芯片上,因為一旦芯片本身的演進出現(xiàn)任何問題,遷移將是用戶不能承受之重。
"所以,用戶都希望有一套更合理的生態(tài)環(huán)境來提供支撐。"浪潮數(shù)據(jù)董事長張東解釋說,"我們不能僅僅從技術(shù)的層面來解讀‘一云多芯',認(rèn)為只要有了‘一云多芯',就能屏蔽掉所有芯片面臨的技術(shù)問題,一勞永逸。站在浪潮云海的角度,我們倡導(dǎo)用戶在構(gòu)建云時,將‘一云多芯'作為一種基本的選擇思路和出發(fā)點,而不是把寶全部押在某一個廠商或某一種芯片架構(gòu)之上。從芯片到服務(wù)器整機再到云操作系統(tǒng),需要整個生態(tài)中每一個層級的廠商共同努力,以‘一云多芯'的機制更靈活地適配底層芯片可能的變化,即使改變發(fā)生,也能夠確保做到平滑穩(wěn)定的切換,不影響業(yè)務(wù)的連續(xù)性。"
歸納來看,在需求側(cè),大數(shù)據(jù)、人工智能、邊緣計算、物聯(lián)網(wǎng)等多樣化的技術(shù)平臺和業(yè)務(wù)應(yīng)用對算力需求的差異越來越大,導(dǎo)致更多算力供給逐漸從處理器向包括GPU、DPU、FPGA等在內(nèi)的各種加速器轉(zhuǎn)移。在此情況下,云平臺必須具備屏蔽底層硬件架構(gòu)差異的能力,并能依據(jù)上層應(yīng)用的特點完成資源的自適應(yīng)調(diào)度和統(tǒng)一管理。而"一云多芯"正好可以滿足用戶算力多樣化的需求,實現(xiàn)從算力的并存到算力的統(tǒng)一。
在供給側(cè),由于芯片架構(gòu)的類型極大豐富,行業(yè)用戶不僅面臨芯片選擇的難題,更要考慮各種類型、架構(gòu)的芯片如何與現(xiàn)有IT基礎(chǔ)架構(gòu)融合的問題。"一云多芯"不僅實現(xiàn)了芯與云的融合,更達成了"平臺+生態(tài)"的協(xié)同。
可以預(yù)見,"一云多芯"將成為未來云計算平臺的剛需。
"一云多芯"自由切換
浪潮云海是業(yè)內(nèi)最早支持"一云多芯",并且擁有豐富的行業(yè)應(yīng)用落地經(jīng)驗的。大約從2018年開始,浪潮云海就幫助政府、金融、能源、交通等行業(yè)的數(shù)百家客戶打造了"一云多芯"行業(yè)云。舉例來說,某大型銀行使用多種芯片服務(wù)器和浪潮云海OS,完成了核心MPP數(shù)倉產(chǎn)品的認(rèn)證測試,并實現(xiàn)了大規(guī)模生產(chǎn)系統(tǒng)應(yīng)用;浪潮云海還助力某省構(gòu)建了國內(nèi)規(guī)模最大、芯片種類最多的省級政務(wù)云平臺,覆蓋近2000臺、三種架構(gòu)處理器的服務(wù)器,并全面集成了基礎(chǔ)軟硬件、云平臺、安全系統(tǒng)、運維管理系統(tǒng)、應(yīng)用系統(tǒng)等,累計完成104個業(yè)務(wù)系統(tǒng)的遷移,以及4個公共應(yīng)用系統(tǒng)的對接。
"浪潮云海打造的政務(wù)云、行業(yè)云、私有云中很多都已經(jīng)是‘一云多芯'。"劉健介紹說,"通過深入實踐,我們慢慢打磨‘一云多芯'平臺,踩過各種各樣的‘坑',逐漸積累經(jīng)驗,讓‘一云多芯'的價值最大程度地在行業(yè)用戶那里得以釋放。"
在多年實踐經(jīng)驗的基礎(chǔ)之上,浪潮云海歸納出了落地"一云多芯"的方法論和成功路徑。浪潮數(shù)據(jù)云計算技術(shù)總監(jiān)亓開元表示:"‘一云多芯'的落地需要一套完整的技術(shù)體系來支持。從浪潮云海的理解,就是由場景驅(qū)動系統(tǒng)設(shè)計,以應(yīng)用為導(dǎo)向,從原來以CPU為核心轉(zhuǎn)向以系統(tǒng)為核心,進行軟硬的協(xié)同化設(shè)計,形成多元異構(gòu)的融合,同時輔以軟件定義技術(shù),持續(xù)提升計算的效率和能效。同時,還要遵從分層解耦和開放標(biāo)準(zhǔn)。也就是說,從芯片加速器部件到整機,再到云操作系統(tǒng)、中間件,直至應(yīng)用,實現(xiàn)全面的分層解耦。只有這樣,才能消除單一技術(shù)生態(tài)的封閉性和離散性,從而在整體上形成‘一云多芯'的標(biāo)準(zhǔn)化和規(guī)范化。"
"一云多芯"的落地要經(jīng)歷一個由淺入深、逐層遞進的過程。因此,浪潮云海提出了"三步走"的戰(zhàn)略。
第一步,實現(xiàn)混合部署、統(tǒng)一管理、統(tǒng)一視圖。在此階段,主要解決"有沒有"的問題。以云為入口,通過云操作系統(tǒng)實現(xiàn)異構(gòu)處理器服務(wù)器的統(tǒng)一管理,覆蓋國內(nèi)外主流處理器,提供統(tǒng)一操作界面、操作方式及統(tǒng)一監(jiān)控運維等,解決應(yīng)用跨架構(gòu)部署與協(xié)同的問題。
第二步,實現(xiàn)業(yè)務(wù)牽引、分層解耦、架構(gòu)升級。這一階段主要解決"好不好用"的問題,進一步實現(xiàn)應(yīng)用的低成本跨架構(gòu)切換。通過資源層、平臺層和應(yīng)用層的"分層解耦"設(shè)計,實現(xiàn)架構(gòu)升級。
第三步,建立算力標(biāo)準(zhǔn)、全棧多芯,推動生態(tài)共建。"一云多芯"的最終目標(biāo)是實現(xiàn)應(yīng)用與芯片架構(gòu)的徹底解耦。這需要硬件、云以及應(yīng)用等產(chǎn)業(yè)鏈上下游的協(xié)同,并且完善異構(gòu)架構(gòu)下有效算力的量化方法,以支持應(yīng)用在不同架構(gòu)處理器間的等價切換。在此基礎(chǔ)上,推動應(yīng)用與云基礎(chǔ)設(shè)施的"一云多芯"相結(jié)合,打造垂直一體化方案,實現(xiàn)應(yīng)用層面的跨架構(gòu)無感知切換。更重要的是,聯(lián)合業(yè)界多方力量,推動"一云多芯"行業(yè)標(biāo)準(zhǔn)的形成。
亓開元介紹說:"我們幫助許多行業(yè)用戶跨越了第一階段,實現(xiàn)了‘一云多芯'在其業(yè)務(wù)中的規(guī)?;渴鸷蛻?yīng)用。當(dāng)前,我們已經(jīng)開始了面向第二階段的技術(shù)布局與探索,結(jié)合原生化的技術(shù),聯(lián)合中間件等廠商,實現(xiàn)平臺層的數(shù)據(jù)同步,包括應(yīng)用層的流量切分等,希望形成一些最佳實踐和指導(dǎo)方案,幫助更多應(yīng)用廠商按照‘一云多芯'的策略上云。"
"一云多芯"是個時髦詞,尤其是在云基礎(chǔ)架構(gòu)廠商中提及頻率更高。雖然"一云多芯"的叫法相同,但由于理解程度的不同、技術(shù)能力的差異等,造成了各廠商在落地"一云多芯"時,效果也不盡相同。
張東強調(diào)說:"從浪潮云海的角度,希望通過云,讓更多不同的處理器架構(gòu)芯片能夠共存在一朵云中,并最終實現(xiàn)上層業(yè)務(wù)在不同的處理器架構(gòu)之間低成本切換或者說自由切換。這也應(yīng)該是整個業(yè)界共同努力的方向。"
浪潮云海希望更多廠商能夠投身于"一云多芯"的大潮中,無論是在產(chǎn)品研發(fā)階段,還是在云的建設(shè)過程中,都能真正從"一云多芯"的角度思考問題,最終構(gòu)建出相關(guān)的標(biāo)準(zhǔn)規(guī)范,推動生態(tài)的建設(shè)與繁榮。
左手生態(tài) 右手標(biāo)準(zhǔn)
"一云多芯"的落地,雖然在技術(shù)上還有很多問題要突破,但從更長遠(yuǎn)發(fā)展的角度來看,帶動整個上層生態(tài)的參與是十分必要且重要的。舉例來說,現(xiàn)在數(shù)據(jù)庫基本都是跑在同一種芯片架構(gòu)上的。浪潮云?,F(xiàn)在想做的一件事是,推動分布式集群數(shù)據(jù)庫的讀和寫"分離",分別運行在不同架構(gòu)的芯片上。浪潮云海正與瀚高等數(shù)據(jù)庫廠商聯(lián)合攻關(guān),解決生態(tài)方面的一些問題。
另外,前文已反復(fù)提到的標(biāo)準(zhǔn)問題,也是影響"一云多芯"長遠(yuǎn)發(fā)展的一個關(guān)鍵因素。當(dāng)產(chǎn)業(yè)發(fā)展真正進入到第三階段時,人們不會再關(guān)心底層的硬件問題,那么作為重要驅(qū)動力的標(biāo)準(zhǔn)問題就會進一步凸顯出來。因此,浪潮云海一直在大力推動算力標(biāo)準(zhǔn)化。算力作為一種標(biāo)準(zhǔn)化的服務(wù),與底層的軟硬件無關(guān),可以是在容器之上,也可以通過API交付。在這個階段,人們的關(guān)注點將完全從底層移至上邊的業(yè)務(wù)層。所以,中間肯定需要一系列的標(biāo)準(zhǔn)來規(guī)范這個生態(tài)。目前,國內(nèi)已有相關(guān)機構(gòu)在推動"一云多芯"標(biāo)準(zhǔn)的編制。算力標(biāo)準(zhǔn)化值得期待!
上云用數(shù)賦智,牽出多樣化的應(yīng)用需求,進而催生出多樣化的算力。這并非是中國"特色",而是一個全球化的趨勢。只不過在當(dāng)前國內(nèi)大的產(chǎn)業(yè)鏈重構(gòu)的背景下,"一云多芯"的討論更具必要性和實際價值。
"我們和一些重要客戶進行過溝通,他們談到一個關(guān)鍵問題,就是任何時候業(yè)務(wù)不能中斷。因此,在多芯片平臺上進行自由無感切換是‘剛需',不能回避。今天,很多用戶都已經(jīng)認(rèn)同了‘一云多芯'的想法。"張東指出,"隨著IT的不斷演進,只要有多處理器需求的環(huán)境,就會有‘一云多芯'的需求。這一市場潛力巨大。"