北京2022年6月28日 /美通社/ -- 隨著企業(yè)數(shù)字化轉型的快速發(fā)展,數(shù)據(jù)呈現(xiàn)爆發(fā)增長趨勢,大數(shù)據(jù)、云計算、AI等新興技術的發(fā)展使得數(shù)據(jù)來源和結構變得更加復雜多樣,基于數(shù)據(jù)的智慧應用不斷涌現(xiàn),帶來了對數(shù)據(jù)存儲質量、傳輸速度等性能需求的提升。固態(tài)硬盤憑借著高性能及其價格的持續(xù)優(yōu)化、綠色節(jié)能的特點,成為了IT核心基礎設施重要選擇,滿足數(shù)字經(jīng)濟時代對高性能、高可靠、容量、綠色節(jié)能的需求。NAND Flash作為SSD閃存盤的基礎單元,就像是超市內部的貨架,其可靠性是存儲系統(tǒng)、數(shù)據(jù)中心穩(wěn)定可靠的基礎保證,浪潮存儲堅持科技創(chuàng)新與工匠精神,結合用戶的場景要求,針對NAND Flash可靠性測試進行了全方位的探索和創(chuàng)新,不斷打磨優(yōu)化確保SSD的高可靠性。
提升NAND可靠性 需要闖過“三關”
浪潮存儲基于大量的NAND測試數(shù)據(jù),在反復探索和實踐推理過程中發(fā)現(xiàn)了企業(yè)級固體硬盤普遍面臨三個挑戰(zhàn):
首先,NAND特性會影響數(shù)據(jù)的可靠性。例如NAND中未寫滿數(shù)據(jù)的塊因數(shù)據(jù)保存能力低會導致RBER ( Raw Bit Error Rate,原始比特錯誤率)升高,經(jīng)過大規(guī)模NAND測試和數(shù)據(jù)分析,量化不同階段影響程度,可以制定出最優(yōu)方法去減少影響并提升固體硬盤的可靠性。
其次是默認讀電壓未能最佳適配NAND特性不能滿足QoS(Quality of Service,服務質量)要求。大量實際業(yè)務讀寫場景中5K P/E(Program/Erase,寫入/擦除)下數(shù)據(jù)保存能力達到90天時就嚴重超出了LDPC(Low Density Parity Check Code,低密度奇偶校驗)糾錯能力,所以NAND測試需給出最優(yōu)電壓來滿足服務質量要求;
第三是NAND廠商提供的Read Retry表如果不夠精細,不經(jīng)實際測試校驗檢測使用會影響產(chǎn)品的服務質量。
全面NAND Flash測試為產(chǎn)品優(yōu)化提供精準數(shù)據(jù)
浪潮存儲的研發(fā)團隊在研究分析全球主流NAND Flash所有特性后,針對NAND Flash測試分析制定了測試流程,并研發(fā)了一款測試分析儀,能給為產(chǎn)品的優(yōu)化提供詳細數(shù)據(jù),提升SSD的可靠性。
第一步是原廠屬性核驗,主要核驗原廠所提供的Timing、壞塊等原廠屬性數(shù)據(jù)的一致性和偏差閾值;第二步是NAND Flash特性極值摸底挖掘,主要是摸底First Read、最優(yōu)讀取電壓等屬性的極值;第三步是最優(yōu)讀電壓的驗證和優(yōu)化以及LLR Table(Log likelihood ratio table,對數(shù)似然比表)的生成,考慮到同型號不同批NAND也存在部分細微差異,對同一型號每一批次NAND Flash都要進行充分驗證以保證測試數(shù)據(jù)的準確性,為了更加全面準確的獲取測試結果,浪潮存儲自主研發(fā)了NAND Prober HX9000測試分析儀。
NAND基礎屬性核驗
在NAND基礎屬性測試方面,主要關注Timing時序、壞塊分布和功耗測試Power Consumption等測試項目。其中Timing測試中會在不同條件下測試讀、寫和擦,例如在不同PE、不同溫度、不同位置獲取最優(yōu)的Timing值給固件性能調優(yōu)提供基礎數(shù)據(jù);壞塊測試主要關注壞塊分布和壞塊率,為固件元數(shù)據(jù)設計以及性能一致性設計提供數(shù)據(jù);功耗測試針對讀寫擦,包含Single、Mulit-plane操作,獲取平均功耗和峰值功耗,峰值功耗是平均功耗的2~3倍,單個峰值持續(xù)時間微秒級別, 硬件需要針對電源及噪聲做設計,固件可以限制并發(fā),避免大量峰值功耗涌現(xiàn)。
NAND特性極值挖掘
NAND基礎特性測試包含首次讀、未寫滿塊、空擦除、最優(yōu)讀電壓、LLR table等方面內容,浪潮存儲正是基于對這些基礎特性的極值的探索,持續(xù)優(yōu)化產(chǎn)品,提升固體硬盤的可靠性。
在First Read方面的優(yōu)化,是考慮閃存顆粒中短時間不讀的數(shù)據(jù)塊(Block),第一次讀取時會存在BER(Bit Error Rate,比特誤碼率)會比較高的狀況,周期刷新可以有效的預防此類問題、通過測試驗證不同溫度下的刷新周期和專用命令和pSLC dummy(portion Single Level Cell,部分單層存儲單元)命令有效性,刷新優(yōu)化不同型號NAND周期。
塊(Block)是NAND Flash中可的擦除的最小單位,由若干個可以讀寫數(shù)據(jù)的頁(Page)組成,這也意味著有些塊中會出現(xiàn)只有部分頁寫滿了數(shù)據(jù),但是系統(tǒng)為了保存這些頁內的數(shù)據(jù)未對整個塊就行擦除,就出現(xiàn)了未寫滿的塊(Open Block), 在固件使用過程中不可避免。
相比寫滿數(shù)據(jù)的塊(Close Block),未寫滿塊的數(shù)據(jù)保存能力會降低。此部分測試的目標就是要對不同寫入量數(shù)據(jù)塊進行不斷的寫入和擦除,在不同情況下測試讀干擾和數(shù)據(jù)保持能力對可靠性的影響,探索能夠保障數(shù)據(jù)塊最強保存能力的最優(yōu)讀電壓和最佳的空擦除次數(shù),為FW設計開發(fā)優(yōu)化進行指導,從而實現(xiàn)NAND實現(xiàn)最高的可靠性。
獲取最優(yōu)讀電壓至關重要,因不準確電壓會影響產(chǎn)品的性能吞吐量、QoS和UBER,主要有兩種方式可以獲取,一種是固定讀電壓離線獲取離線訓練,F(xiàn)W使用相對簡單,但對NAND一致性要求較高;另一種是動態(tài)更新最優(yōu)讀電壓,F(xiàn)W要周期性找到最優(yōu)讀電壓,缺點是獲取過程中對Qos有影響,但通用性更好。根據(jù)不同型號的NAND一致性的實際數(shù)據(jù),可以選擇獲取最優(yōu)讀電壓的最佳方式。
參數(shù)表驗證調優(yōu)
獲取最優(yōu)讀電壓參數(shù)后,仍需要進行多輪的驗證和優(yōu)化,包括基于實際NAND信道生產(chǎn)LLR table,LDPC 軟解碼的算法可以利用NAND Flash的數(shù)據(jù)和LLR table數(shù)據(jù)提升糾錯能力和性能。LLR生成的主要過程是通過NAND測試儀器生成LLR相關數(shù)據(jù),再采用專用LLR工具生成LLR table,然后將LLR table放到LDPC仿真環(huán)境中驗證和產(chǎn)品的調優(yōu)。
為了快速、準確、批量化測試分析NAND Flash各類特性,浪潮自主研發(fā)了高度模塊化的NAND Prober HX9000測試分析儀,支持SLC/MLC/TLC/QLC等多種存儲單元的閃存顆粒的NAND特性測試,具有高精準、簡潔易用的用戶界面,可以滿足進行閃存介質特性分析、穩(wěn)定性追蹤、壽命檢測、算法優(yōu)化和測試等應用,為產(chǎn)品的優(yōu)化提升了準確性和效率。
浪潮存儲采用了行業(yè)領先的智能高溫控制器和自主創(chuàng)新的P/E 塊讀寫算法并行收集閃存介質的實時狀態(tài),支持NAND介質High Level、Low Level指令集,圖形化界面,全方位監(jiān)測介質實時狀態(tài),通過開放的API(Application Programming Interface,應用程序接口)接口,為用戶提供自定義的介質特性控制、監(jiān)測和狀態(tài)數(shù)據(jù)收集服務,設備購置和擁有成本有效的進行了降低,通過使用NAND測試分析儀,提升了閃存主控芯片的設計、性能優(yōu)化、介質壽命管控效率,有效提升主控芯片特性、優(yōu)化SSD整盤性能和可靠性,同時可以用于存儲介質的新特性和新材料研究,支撐對傳統(tǒng)介質新特性和新介質新特性的測試、收集和分析,為未來產(chǎn)品的開發(fā)提供了重要支撐和保障。
可靠性提高30%以上
浪潮SSD通過嚴謹苛刻的測驗優(yōu)化,產(chǎn)品的各項規(guī)格指標已經(jīng)達到業(yè)界領先,再通過測試在不同PE、Retention、Read Disturb組合下去找最優(yōu)電壓,使得采用的NAND壽命和可靠性可以提高到30%以上,QoS水平可以達到99.99%,處于業(yè)內領先水平,同時做到整個生命周期內性能保持不變,用戶整體TCO降低20%以上。
浪潮在存儲基礎領域不斷下沉研發(fā)創(chuàng)新,將底層硬件關鍵核心部件技術與整機系統(tǒng)技術進行結合,發(fā)揮閃存的高效、可靠、綠色的優(yōu)勢,結合客戶應用場景,以技術創(chuàng)新優(yōu)化產(chǎn)品方案助力關鍵行業(yè)實現(xiàn)突破應用,全面釋放數(shù)據(jù)價值,加速數(shù)字化轉型。