北京2023年3月9日 /美通社/ -- 在開源社區(qū)建設過程中,浪潮云海OS團隊始終秉承源于開源、饋于開源、完善開源的理念,不斷優(yōu)化社區(qū)已有功能、收集客戶需求并積極貢獻到相關開源項目,以完善私有云的資源池化、跨云遷移、異構管理、服務編排、智能運維、容災備份和安全保障等場景,有效提升了OpenStack在私有云中大規(guī)模應用場景中的靈活性、智能性、安全性和穩(wěn)定性。在業(yè)務上云的趨勢下,行業(yè)用戶普遍利用云的彈性、便捷特性來自動、高效地保障云上業(yè)務的可靠性。在需求驅動下,浪潮云海OS團隊通過自研容災管理組件Neptune為用戶提供管理工具,以打通信息中心各系統(tǒng)之間的數(shù)據(jù)壁壘。
聚焦關鍵業(yè)務 提供連續(xù)保障
云計算已深入到了金融、政務、交通等行業(yè)并承載了眾多關鍵性業(yè)務,但是在云平臺遇到大規(guī)模災難性破壞后,如何快速恢復保證業(yè)務連續(xù)性成為了各行業(yè)用戶的急迫需求,特別是金融行業(yè),對服務可靠性要求極高。浪潮云海 OS基于在OpenStack社區(qū)貢獻的技術創(chuàng)新,實現(xiàn)了容災備份功能,從客戶的實際需求出發(fā),結合多種業(yè)務場景,為客戶提供了高等級的計算、存儲、網(wǎng)絡服務的容災能力。
容災功能利用存儲的遠程復制能力實現(xiàn)數(shù)據(jù)同步復制,使生產(chǎn)中心云主機每一次數(shù)據(jù)IO實時同步到容災中心的存儲設備中,直到容災中心的數(shù)據(jù)落盤再返回IO成功。這一技術可保證云主機的數(shù)據(jù)在兩個數(shù)據(jù)中心的絕對一致性,以達到RPO=0,RTO接近0的容災能力。
容災資源的創(chuàng)建、刪除和切換等管理功能依賴于浪潮云海 OS自研容災管理組件Neptune,Neptune分別部署在主備兩個容災中心,對接各自中心的存儲設備進行容災管理。浪潮云海OS在為生產(chǎn)云主機增加容災保護時,首先會根據(jù)生產(chǎn)云主機的規(guī)格在容災中心通過Cinder創(chuàng)建相同規(guī)格的云硬盤,然后通過Neptune組件,在存儲上創(chuàng)建兩個云硬盤的遠程復制關系,接著在容災中心根據(jù)這個云硬盤創(chuàng)建出容災云主機。至此生產(chǎn)云主機已經(jīng)具備容災能力,開啟保護后,生產(chǎn)云主機的數(shù)據(jù)就會實時同步至容災中心對應的容災云主機中。
當生產(chǎn)中心發(fā)生故障時,浪潮云海 OS可實現(xiàn)一鍵故障切換,通過調(diào)用備中心Neptune進行云硬盤的故障切換,同時拉起容災中心對應的容災云主機,既可有效保障關鍵業(yè)務的連續(xù)性,又可通過Neptune組件,實現(xiàn)云主機的主備切換、主備回切、故障修復后的重保護功能。Neptune組件是浪潮云海團隊根據(jù)容災業(yè)務模式設計開發(fā)的容災模塊,填補了OpenStack集群之間容災的空白,Neptune組件提供了兩個集群之間若干云主機容災的管理界面,并且可以自定義將若干云主機劃分為單個相對獨立的保護組。浪潮云海秉承開放兼容原則,一方面Neptune面向上層管理平面提供標準的Rest API接口,另一方面,Neptune向下提供標準的driver實現(xiàn)業(yè)務邏輯與底層硬件的松耦合,保障了對底層硬件廠商的兼容性,該組件未來將貢獻至OpenStack社區(qū)。
模擬容災演練 實現(xiàn)云上運維
在日常生產(chǎn)運營中,浪潮云海OS支持在不影響業(yè)務穩(wěn)定運行的前提下,利用快照技術,在備中心創(chuàng)建出與備云主機相同規(guī)格的演練云主機等資源,提供實時或計劃性的容災演練功能,以此模擬真實故障時故障恢復的場景,來制定各項業(yè)務應急恢復預案,定期驗證業(yè)務容災有效性。同時浪潮云海OS支持實時或計劃性的主備切換,以配合客戶軟硬件調(diào)整,盡可能保障關鍵業(yè)務的連續(xù)性。
浪潮云海OS通過信息資源整合、搭建統(tǒng)一云服務平臺可實現(xiàn)業(yè)務系統(tǒng)"云上"運行,能夠有效解決行業(yè)用戶面臨的運行環(huán)境復雜、運維管理復雜等難題。此外,浪潮云海OS雙活云平臺同城災備系統(tǒng),能夠解決單一數(shù)據(jù)中心故障風險問題,提高用戶系統(tǒng)運營的安全性和穩(wěn)定性。當前,浪潮云海OS已經(jīng)廣泛應用于各行各業(yè),例如在民航領域,采用浪潮云海主備數(shù)據(jù)中心建設模式構建同城容災備份體系,當主數(shù)據(jù)中心出現(xiàn)故障時,災備中心可在規(guī)劃恢復時間內(nèi)快速接管外網(wǎng)關鍵核心業(yè)務系統(tǒng),減少關鍵、核心業(yè)務停機時間,全面保障應用系統(tǒng)的高可用性,同時配備完善的容災備份應急演練預案,保障容災備份工作高效有序開展,實現(xiàn)關鍵信息互聯(lián)互通,推動智慧民航建設。
云管組件是災備向全行業(yè)延伸應用的關鍵,除此之外,浪潮云海OS團隊不斷優(yōu)化社區(qū)已有功能并完善私有云場景,有效提升了OpenStack私有云在中大規(guī)模應用場景中的性能和穩(wěn)定性,同時,面向各個方向培養(yǎng)了杰出的開源貢獻者,不斷優(yōu)化并完善計算、存儲、網(wǎng)絡、裸金金屬等核心模塊功能特性,推動了OpenStack技術的持續(xù)創(chuàng)新和開源社區(qū)的蓬勃發(fā)展。
一直以來,浪潮云海OS通過在架構優(yōu)化、權威基準測試、規(guī)?;瘧谩⑸鐓^(qū)貢獻、生態(tài)完善等方面的持續(xù)創(chuàng)新,構建了開放、融合、敏捷、智能的云操作系統(tǒng),為各行各業(yè)提供數(shù)字轉型、智能升級、融合創(chuàng)新的云基礎設施。同時持續(xù)推動OpenStack、Kubernetes等開源技術在中國及世界范圍的發(fā)展,為打造創(chuàng)新技術引擎不懈努力。