深圳2024年11月29日 /美通社/ -- 各行業(yè)領(lǐng)域的AI應(yīng)用正步入爆發(fā)式增長期,智算亟需從"建好"向"管好用好"轉(zhuǎn)變。從即將于12月3日到5日盛大舉行的中國電信數(shù)字科技生態(tài)大會的主題"AI賦能 共筑數(shù)字新生態(tài)"可以看出,中國電信將通過加強行業(yè)生態(tài)開放合作來干好這件大事。
此方面的一個重大亮點是,5G公眾號觀察到,"航母級"半導(dǎo)體存儲龍頭、已進入中國電信旗艦級國產(chǎn)化服務(wù)器設(shè)備供應(yīng)鏈清單的江波龍,將在大會期間全面展示PTM(存儲產(chǎn)品技術(shù)制造)商業(yè)模式,以及覆蓋芯片設(shè)計、固件開發(fā)、技術(shù)定制、封裝測試、生產(chǎn)制造等方面的全棧定制價值服務(wù)能力,在這些能力加持下,江波龍能夠以"靈活""高效""創(chuàng)新"的產(chǎn)品和服務(wù)賦能中國電信智算及其產(chǎn)業(yè)鏈。
1、AI智算落地,迫切需要服務(wù)器存儲產(chǎn)品"定制化"
目前AI智算中心仍然存在算力利用率低及商業(yè)閉環(huán)難的問題,亟需考慮如何服務(wù)海量客戶用好算力,從而亟需解決客戶的痛點。
隨著AI大模型商業(yè)落地加速,各行業(yè)領(lǐng)域客戶不再僅關(guān)注堆疊算力,越來越關(guān)注數(shù)據(jù)存儲,因為數(shù)據(jù)存儲是日益走向多模態(tài)的AI大模型在數(shù)據(jù)收集、預(yù)處理、訓(xùn)練、推理的關(guān)鍵一環(huán),決定著能保存的數(shù)據(jù)容量、訓(xùn)練及推理的數(shù)據(jù)讀取效率、數(shù)據(jù)的可靠性以及數(shù)據(jù)安全。
當(dāng)千行萬業(yè)的海量客戶都高度關(guān)注數(shù)據(jù)存儲時,服務(wù)器存儲領(lǐng)域?qū)Υ鎯Ξa(chǎn)品的需求必然日益多樣化和個性化,傳統(tǒng)標準化產(chǎn)品已難以滿足服務(wù)器存儲的特定需求。
2、江波龍支撐中國電信按需定制化的存儲解決方案
海量客戶在數(shù)據(jù)存儲上目前存在諸多痛點,5G公眾號觀察到,江波龍的PTM模式通過技術(shù)定制與聯(lián)合創(chuàng)新,根據(jù)服務(wù)器的具體需求提供定制化的存儲解決方案,這種極大的靈活性有助于服務(wù)器存儲更好地應(yīng)對不同應(yīng)用場景下的挑戰(zhàn),提升性能和穩(wěn)定性,很好解決了痛點,已經(jīng)初步為中國電信創(chuàng)下了很大價值。
AI智算生產(chǎn)力能否充分釋放和發(fā)揮價值,"數(shù)據(jù)效率"將是關(guān)鍵。
為了提升AI的全流程效率,減少算力等待時間,需要存儲具有更高的性能,需要超越傳統(tǒng)存儲數(shù)倍的性能,比如支持PB級帶寬和億級IOPS。
AI時代,數(shù)據(jù)成為海量客戶重要的價值資產(chǎn),數(shù)據(jù)的留存率將越來越高,數(shù)據(jù)增速由此將會指數(shù)級提升,從而對存儲容量提出更高要求。
綜上,亟需通過數(shù)據(jù)存儲的性能、容量的優(yōu)化來提升數(shù)據(jù)效率,解決性能瓶頸、容量限制。
此外,可以預(yù)見隨著AI大模型算力集群規(guī)模不斷增長,"算力等待數(shù)據(jù)"所產(chǎn)生的"算力空載"問題將日漸嚴重,亟需加速存儲數(shù)據(jù)訪問效率以提升算力利用率。
對于上述痛點,5G公眾號觀察到江波龍通過PTM商業(yè)模式,提供了多種定制化的存儲解決方案。從NAND Flash、DRAM、主控芯片、軟件到硬件/元器件,江波龍都采用了符合客戶業(yè)務(wù)目標的存儲組合,滿足客戶的差異化戰(zhàn)略需求,提升其在快速變化市場中的應(yīng)變能力和業(yè)務(wù)連續(xù)性。
其中的閃存存儲的高性能、大容量、低功耗,在有限空間內(nèi)提供驚人的性能密度和容量密度,而且可極大縮短數(shù)據(jù)讀取和寫入的時間,顯著提高數(shù)據(jù)處理的效率,對于中國電信大規(guī)模算力發(fā)揮出其應(yīng)有作用具有重要意義。
一個很大的亮點是,上述NAND Flash+DRAM+主控芯片+軟件/硬件、元器件均采用國產(chǎn)化供應(yīng)商;此外,對于面向低時延和高速計算的RDIMM企業(yè)級內(nèi)存條,江波龍自主研發(fā)的PCB線路板提升了信號質(zhì)量。5G公眾號認為這些對于中國電信構(gòu)建自主可控、穩(wěn)定可靠的產(chǎn)業(yè)鏈生態(tài)具有重要保障能力。江波龍企業(yè)級UNCIA 3836 SATA SSD和DDR4 RDIMM在2024年首次躋身中國電信合格供應(yīng)商清單,并一次性成功通過中國電信的嚴格測試,意味著江波龍的產(chǎn)品力、服務(wù)力、質(zhì)量體系都得到了中國電信的高度認可。
AI訓(xùn)練和推理需要大量計算資源,智算中心需要配備多種主流高性能CPU平臺。要確保服務(wù)器穩(wěn)定運行和高效性能,服務(wù)器存儲對這些主流CPU平臺的兼容性是一大關(guān)鍵。
目前的一大痛點就是服務(wù)器存儲的兼容性需要提升,缺少主流平臺兼容性可能無法支持最新的系統(tǒng)和軟件。
相關(guān)兼容是一個很復(fù)雜的過程,需要確保物理接口、電氣性能、數(shù)據(jù)傳輸速率、容量和擴展性等方面的匹配,以及進行兼容性測試與驗證等,如果通信運營商自己做,會耗費大量的人力和時間。
江波龍企業(yè)級SSD產(chǎn)品(含SATA與PCIe)均已成功完成與鯤鵬、海光、龍芯、飛騰、兆芯、申威多個國產(chǎn)CPU平臺服務(wù)器的兼容性適配。5G公眾號認為可以很好助力中國電信確保整體系統(tǒng)的穩(wěn)定性和性能。
高性能的數(shù)據(jù)讀寫是提升算力資源利用率、減少端到端訓(xùn)練周期的關(guān)鍵。傳統(tǒng)的機械硬盤存儲已經(jīng)無法滿足快速訪問和處理大規(guī)模數(shù)據(jù)的需求,數(shù)據(jù)存儲需要全面走向全閃存。SSD可以帶來建設(shè)成本、空間、能耗等端到端的節(jié)省。
中國電信合格供應(yīng)商清單中包含江波龍企業(yè)級UNCIA 3836 SATA SSD和DDR4 RDIMM,對于供應(yīng),5G公眾號注意到不同于存儲業(yè)界"生產(chǎn)環(huán)節(jié)過于依賴多地協(xié)作"的現(xiàn)狀,江波龍PTM模式實現(xiàn)了生產(chǎn)全鏈條一站式完成,強調(diào)高質(zhì)量智能制造,通過其在中山的自有數(shù)據(jù)中心存儲專線,定制高精度SMT企業(yè)級專用產(chǎn)線,可確保eSSD+RDIMM產(chǎn)品的品質(zhì)和穩(wěn)定性,同時保障穩(wěn)定的產(chǎn)能供應(yīng)。
可見在PTM模式下,江波龍可提供更加靈活、開放、透明和創(chuàng)新的定制化存儲產(chǎn)品和服務(wù)。
對于千行萬業(yè)的海量客戶而言,以往對于"數(shù)據(jù)安全",往往很重視網(wǎng)絡(luò)安全,經(jīng)常忽視讓數(shù)據(jù)存儲發(fā)揮出數(shù)據(jù)"保險柜"的作用。
但是隨著AI大模型快速走向千行萬業(yè),數(shù)據(jù)開始成為其核心資產(chǎn),"存儲原生安全"成為千行萬業(yè)海量客戶的基本需求。
此外,為了滿足國家相關(guān)政策的監(jiān)管和等保要求,智算中心也要避免由于停電或宕機等導(dǎo)致核心業(yè)務(wù)系統(tǒng)中斷或數(shù)據(jù)丟失。
對于上述痛點,5G公眾號觀察到江波龍有很好的解決方案,以eSSD為例,江波龍企業(yè)級UNCIA 3836 SATA SSD在設(shè)計階段就預(yù)設(shè)、集成了增強掉電保護、RAID保護和端到端數(shù)據(jù)保護等自研安全固件,不僅滿足了客戶的特定需求,還顯著提升了服務(wù)器數(shù)據(jù)的安全性,降低了因數(shù)據(jù)丟失或損壞而導(dǎo)致的業(yè)務(wù)中斷風(fēng)險。
此外,其專項配備的AE(應(yīng)用工程師)、RD(研發(fā)工程師)和FAE(現(xiàn)場應(yīng)用工程師)團隊能夠為客戶提供固件升級等技術(shù)支持,進一步降低客戶的維護成本。
在智算中心的讀/寫密集型應(yīng)用場景,傳統(tǒng)服務(wù)器的啟動盤存在性能瓶頸,容易導(dǎo)致系統(tǒng)啟動和運行速度變慢,要求eSSD同時具備高耐用性和高擦寫次數(shù)。
然而,要按照企業(yè)級標準進行這些指標的驗證,需要經(jīng)歷定義測試目標、選擇測試工具、設(shè)計測試方案、執(zhí)行測試、評估和優(yōu)化、持續(xù)監(jiān)控和測試等極為繁瑣的過程,需要投入大量的成本。
江波龍通過中山存儲產(chǎn)業(yè)園和蘇州封測制造基地為客戶提供測試和制造服務(wù),在PTM商業(yè)模式下,在產(chǎn)品導(dǎo)入前期與客戶緊密合作進行聯(lián)合測試,利用業(yè)界高標準的自有測試設(shè)備,以及自主研發(fā)的自動化測試腳本——在與中國電信的合作案例中應(yīng)用了約7000個測試腳本,大幅提升了測試效率,顯著減少了人工操作的介入,并提高了前期驗證的準確性。
通過深入的PTM定制測試,江波龍與中國電信合作的企業(yè)級UNCIA 3836 SATA SSD的MTBF(平均無故障時間)指標提升了25%。憑借低故障率、高性能、一致性的產(chǎn)品特性,預(yù)估客戶的開發(fā)部署效率提升約30%,成本降低約20%。
上述的"聯(lián)合測試",不僅可確保產(chǎn)品從源頭上滿足中國電信的需求,還有利于啟動QLC產(chǎn)品前沿技術(shù)早期預(yù)研的聯(lián)合創(chuàng)新,推動eSSD的成本持續(xù)降低。
3、用戶至上,超越客戶期望。以數(shù)為筆,智繪未來
綜上可見,江波龍獨特創(chuàng)新的PTM模式,其技術(shù)定制與聯(lián)合創(chuàng)新、高質(zhì)量智能制造,可為中國電信智算提升市場競爭力提供強有力、定制化、供應(yīng)穩(wěn)定、更靈活的存儲產(chǎn)品定制和技術(shù)支持、更完善且更具價值的全棧定制化服務(wù)和一站式交付,極具助力中國電信智算提升其在快速變化市場中的應(yīng)變能力和業(yè)務(wù)連續(xù)性的潛力。5G公眾號相信在PTM模式下,堅持"用戶至上,用心服務(wù)"理念的中國電信與以"超越客戶期望"為企業(yè)使命的江波龍能很好滿足海量客戶對于服務(wù)器存儲的個性化、差異化需求,從而更好支撐AI加速落地千行萬業(yè)。