北京2022年1月18日 /美通社/ -- 人來貨往的碼頭車站,無數(shù)貨物在有序的奔赴各自的目的地;阡陌縱橫的田間地頭,無人機(jī)值守著一望無際的萬畝良田;緊張忙碌的生產(chǎn)車間,一排排成熟的機(jī)器手臂,代替人力重復(fù)著日復(fù)一日的勞作……
這一幅幅生機(jī)勃勃的,由科技創(chuàng)新勾畫的數(shù)字經(jīng)濟(jì)藍(lán)圖背后,似乎是神奇的“神筆馬良”揮舞著一支“神筆”在妙筆生花,而那支神奇的毛筆,都有一個(gè)相同的名字,就叫做:計(jì)算力。
當(dāng)這支“神筆”用蒼勁的筆鋒,在千行百業(yè)數(shù)字化轉(zhuǎn)型的場(chǎng)景中,將無數(shù)個(gè)需求一一呈現(xiàn)。在筆鋒之下,計(jì)算力的最基本的承載單元“服務(wù)器”的身上,也藏著很多不為人知的秘密。
最關(guān)鍵的一個(gè)就是:空間。
在同樣一塊物理空間內(nèi),承載的計(jì)算力越多,計(jì)算力所能畫出的色彩和畫面也就越豐富。換言之,如果同一塊物理空間內(nèi)的計(jì)算力能夠翻倍,那么計(jì)算力所承載的數(shù)字經(jīng)濟(jì)價(jià)值也同樣可以倍增。
這就是,方寸之間的魔法,賦予數(shù)字經(jīng)濟(jì)最非凡的意義。
而浪潮信息,正手握“匠心”的魔法棒,在服務(wù)器的“方寸之間”,施展著“點(diǎn)石成金”的秘術(shù)。
https://haokan.baidu.com/v?vid=14978933364893647669
空間魔法
浪潮信息的服務(wù)器研發(fā)部門,接到了一個(gè)“不可能完成”的任務(wù):挖掘現(xiàn)有服務(wù)器物理空間,將信息容量翻一倍,還要算得快,跑得穩(wěn)。
浪潮信息服務(wù)器產(chǎn)品總設(shè)計(jì)師陳彥靈表示,“服務(wù)器的設(shè)計(jì)標(biāo)準(zhǔn)化程度很高,在2U的固定空間里,服務(wù)器的零組件之間的協(xié)同關(guān)系早已確立,信息容量翻倍,設(shè)備就增加一倍,盲目壓榨空間會(huì)直接影響運(yùn)轉(zhuǎn),既要保證數(shù)據(jù)裝得下,還要跑的穩(wěn),在原有基礎(chǔ)上做到信息容量倍增,是一個(gè)極大的難題?!?/p>
在有限空間下不斷提高計(jì)算密度,同時(shí)具備強(qiáng)大IO擴(kuò)展性,滿足計(jì)算需求并突破數(shù)據(jù)傳輸瓶頸,一直是浪潮服務(wù)器追求的目標(biāo)。因此,浪潮信息決定在NF5266M6服務(wù)器上解決這個(gè)難題。
研發(fā)團(tuán)隊(duì)通過服務(wù)器結(jié)構(gòu)仿真,決定拋棄原有的托起式結(jié)構(gòu),將硬盤固定在邊框上,實(shí)現(xiàn)2U空間3層24塊硬盤的架構(gòu)。但光固定住硬盤是不行的,還要方便運(yùn)維,要讓設(shè)備“拿得起,放得下”。為此,工程師從傳統(tǒng)工藝中汲取靈感,設(shè)計(jì)了便于拆卸的邊框卡隼機(jī)構(gòu),合理布局內(nèi)部結(jié)構(gòu),在無數(shù)次的實(shí)驗(yàn)打磨之后,終于實(shí)現(xiàn)了計(jì)算、存儲(chǔ)和IO的極致均衡。
并由此做到,1臺(tái)5266M6服務(wù)器可提供相當(dāng)于1.5-2臺(tái)通用服務(wù)器的存儲(chǔ)容量,不僅節(jié)省成本,更關(guān)鍵的是數(shù)據(jù)容量提升了一倍。
這個(gè)小小的,基于“空間”的故事,其實(shí)反映了浪潮信息的“匠心”精神。
廣義的工匠精神,是指對(duì)產(chǎn)品的精雕細(xì)琢,精益求精,一絲不茍與持之以恒。它雖然不是從0到1的發(fā)明創(chuàng)新,但卻是從1到100的關(guān)鍵晉級(jí)方式。
尤其在企業(yè)級(jí)市場(chǎng),云計(jì)算大行其道,物理機(jī)的存在感,在應(yīng)用端缺乏感知,但并不代表物理機(jī)就失去了創(chuàng)新精神,浪潮信息用“空間”故事,告訴我們?nèi)魏位A(chǔ)技術(shù),都有創(chuàng)新的意義。
匠心的故事
實(shí)際上,在浪潮M6服務(wù)器身上,不為人知的匠心故事比比皆是。
比如供電的故事。
由于服務(wù)器的性能越來越高,導(dǎo)致電源消耗越來越大,例如電源在相同的密度下,功耗提升很大,從過去550瓦已提升到2200瓦,但是電源效率的提升,依然跟不上客戶場(chǎng)景的功耗。
為了保證系統(tǒng)1+1冗余,系統(tǒng)負(fù)載的峰值隨時(shí)可能會(huì)突破2200瓦,這就會(huì)導(dǎo)致系統(tǒng)斷電。大家知道,英特爾在CPU上有一個(gè)技術(shù)可以設(shè)置:功耗到達(dá)2200瓦,CPU自動(dòng)降低工作負(fù)載,以犧牲計(jì)算性能為代價(jià),降低功耗。
浪潮信息站在客戶的視角,這是客戶難以理解的,為了保證負(fù)載的穩(wěn)定,為什么要犧牲計(jì)算能力?對(duì)客戶來說,又快又穩(wěn)才是他們的目標(biāo)。
因此,浪潮信息設(shè)計(jì)了動(dòng)態(tài)PowerCapping,可以動(dòng)態(tài)檢測(cè)電源的狀態(tài),讓客戶在電源安全的情況下,實(shí)現(xiàn)最高性能。
再比如,NF5266M6和上一代NF5266M5相比,是完全不同的產(chǎn)品。為什么?
因?yàn)槔顺痹贛6上做功耗升級(jí),散熱就會(huì)受到影響,如果深度要保持和M5長(zhǎng)度一致的話,就要2層架構(gòu)改為3層架構(gòu)。那么以前每層可以放12個(gè)硬盤,現(xiàn)在每層放8個(gè)硬盤,做到把硬盤的位置讓給主板。但是,3層24塊的硬盤要怎么擺放?這里面又是一個(gè)“方寸之間”的魔法故事。
硬盤最大的挑戰(zhàn)是,單個(gè)盤的可維護(hù),同時(shí)還要保證有足夠的間隙而不產(chǎn)生摩擦。如果是此前的兩層設(shè)計(jì),空間就足夠,但是3層架構(gòu)就不那么容易實(shí)現(xiàn)。
因此浪潮將過去的從鐵件轉(zhuǎn)成了壓鑄件,以承載更多的重量,但是改成鑄件,插拔又很難設(shè)計(jì),經(jīng)過了非常多的試驗(yàn)和探索,浪潮創(chuàng)新的發(fā)明了滾珠滑軌的設(shè)計(jì),通過滾珠實(shí)現(xiàn)抽拉。
這個(gè)看似有些“奇怪”的設(shè)計(jì),可謂是一舉兩得:第一,保證了足夠的散熱通道,第二,以滾珠代替滑軌保證整個(gè)結(jié)構(gòu)順暢的插拔。
所以,匠心不僅是高品質(zhì)的代名詞,是產(chǎn)品細(xì)節(jié)的精益求精,也是看得見摸得著的設(shè)計(jì)理念?;蛟S,真正的匠心品質(zhì),就是在你永遠(yuǎn)想不到的場(chǎng)景中,保持產(chǎn)品不斷突破過去無法企及的高度。
以客戶視角做創(chuàng)新
從這些設(shè)計(jì)的細(xì)節(jié),我們就不難理解為什么浪潮服務(wù)器過去幾年,在全球市場(chǎng)和中國(guó)市場(chǎng)保持的快速增長(zhǎng),所有的成績(jī)都來自于每一處細(xì)節(jié)的創(chuàng)新,這是浪潮信息通過M6服務(wù)器呈現(xiàn)出來的品牌價(jià)值。
基于這一個(gè)系列服務(wù)器,浪潮信息所表現(xiàn)出來的能力,還有很多。
例如在硬件層面,通過雙層電源防護(hù),過載實(shí)時(shí)響應(yīng)措施確保系統(tǒng)供電安全;固件層面,M6依靠FPGA作為平臺(tái)信任根,可為BIOS、BMC等固件提供保護(hù),實(shí)現(xiàn)啟動(dòng)監(jiān)測(cè)恢復(fù),開機(jī)過濾,做到固件運(yùn)行全過程安全可靠;系統(tǒng)層面,M6服務(wù)器以零故障、無宕機(jī)和免風(fēng)險(xiǎn)為目標(biāo)制定系統(tǒng)安全策略等等。
再比如模塊的應(yīng)用的難題,因?yàn)楣饽K在70度的環(huán)境里,熱敏部件故障率會(huì)增加三到四倍。而浪潮NF5260M6做到了既支持前IO,又支持后IO,后邊只有電源線,這個(gè)設(shè)計(jì)就讓熱敏感器的可靠性變高了。
除此之外,還有精益智能化運(yùn)維工具ISPIM v6版本,可以實(shí)現(xiàn)十萬臺(tái)級(jí)別異構(gòu)設(shè)備的管理。同時(shí),這個(gè)軟件不僅能管理浪潮服務(wù)器,還可以管理其他品牌的服務(wù)器、存儲(chǔ)和網(wǎng)絡(luò)。并且可以實(shí)現(xiàn)故障診斷和云端故障處理和報(bào)警。對(duì)于十萬級(jí)的數(shù)據(jù)中臺(tái)來講,這套智能化運(yùn)維管理,可以讓資產(chǎn)管理效率提升到95%,前預(yù)警后診斷的準(zhǔn)確率超過90%。
浪潮的數(shù)據(jù)顯示:新一代M6服務(wù)器相比M5在性能上有很大的提升,其中整體計(jì)算性能提升46%,應(yīng)用測(cè)試Redis的延遲可以降低46%,TPS可以提升45%,MySql數(shù)據(jù)庫延遲降低36%,可見整體平臺(tái)的性能提升是非常大的。
也許有人會(huì)問,上一個(gè)時(shí)代的浪潮M5已經(jīng)是業(yè)界的標(biāo)桿了,為什么還要極致設(shè)計(jì)出M6?
因?yàn)?,M5是基于幾年前用戶的應(yīng)用場(chǎng)景去設(shè)計(jì)的,但是用戶的應(yīng)用場(chǎng)景和需求在不斷變化,技術(shù)也在不斷的變化,浪潮信息要隨著時(shí)代的更迭持續(xù)創(chuàng)新,才能讓計(jì)算力賦能千行百業(yè),因此才有了M6的誕生。
同時(shí),浪潮會(huì)在M6上突破基準(zhǔn)和要求去做一些更高技術(shù)的東西,本質(zhì)上也是一種客戶視角的使然。比如滾珠滑軌,就是考慮到客戶要更容易插拔,正是這種客戶視角,讓每一代產(chǎn)品,都能成為客戶的首選。