北京2021年8月19日 /美通社/ -- 作為世界經(jīng)濟發(fā)展以及新一輪科技產(chǎn)業(yè)創(chuàng)新的核心領域,生物醫(yī)藥產(chǎn)業(yè)正快速挺進蓬勃發(fā)展階段。對此,被譽為國家級實驗室“預備隊”的生物島實驗室,應勢選擇了以云智一體為核心的浪潮云??蒲性平鉀Q方案,為更加智能地開展科研醫(yī)療工作,投身建設生物醫(yī)學大數(shù)據(jù)科研軟件平臺中。
為了更好整合國內(nèi)外再生醫(yī)學與健康領域創(chuàng)新資源,積極布局以再生醫(yī)學前沿基礎研究、臨床創(chuàng)新研究等為代表的重要科研方向,進一步打造再生醫(yī)學與健康前沿研究基地、臨床應用基地與高水平人才基地,并加快推進生物醫(yī)學科研創(chuàng)新應用向云智一體化方向發(fā)展,生物島實驗室攜手浪潮云海,如火如荼地展開了生物醫(yī)學大數(shù)據(jù)科研軟件平臺的建設工作。
遭遇平臺建設“絆腳石” 部署、算力、管理、應用均有疑難
盡管平臺建設意義重大,但著手之初還是不可避免“遭遇”了來自節(jié)點采集、算力支持、管理協(xié)同以及應用創(chuàng)新等“絆腳石”,具體來說:
“節(jié)點部署限制多 彈性穩(wěn)定成剛需”為了更好助力醫(yī)療業(yè)務效率提升以及精準醫(yī)療大數(shù)據(jù)應用,高效的數(shù)據(jù)采集變得十分關鍵,而節(jié)點部署更是重中之重。通常,采集節(jié)點主要部署在數(shù)據(jù)源單位例如醫(yī)院中,來負責本地采集、挖掘分析以及共享管理等工作,數(shù)據(jù)來源更是涉及HIS、RIS、LIS、 PACS、基因、組學等多類型系統(tǒng),復雜量大,需要滿足采集節(jié)點對資源彈性、擴展性、穩(wěn)定性等方面的需求。
如此看來常規(guī)的物理機部署架構很難滿足上述要求,采用輕量高效、高穩(wěn)定性、易運維擴展的虛擬化架構來支撐采集節(jié)點部署,就顯得十分重要。
“高效算力更關鍵 效率提升最迫切”眾所周知,生物醫(yī)學研究以數(shù)據(jù)量大、計算要求高等特質(zhì)著稱。舉個例子來說,有數(shù)據(jù)顯示一次人體的全基因組檢測就會產(chǎn)生超過100G的數(shù)據(jù)量,就算做局部檢測涉及到的大樣本批量處理也會帶來極高的計算需求。
此外針對某種疾病的研究,更是需要通過對多達幾千對的基因數(shù)據(jù)進行測序工作才可完成研究第一步,而目前的醫(yī)療機構以現(xiàn)階段的設備水平則需數(shù)年才可搞定。反觀傳統(tǒng)CPU的運算能力,根本無法支撐如此生物醫(yī)學科研需求,所以如何通過新建更高性能的算力平臺來提升科研分析訓練的效率,也成為本次平臺建設需要重點考量的問題。
“多分支管理難度大,資源協(xié)同是關鍵”過去,實驗室中多個數(shù)據(jù)采集節(jié)點基本呈現(xiàn)分散無序的狀態(tài),對此帶來的資源協(xié)同難度大、運維管理更復雜以及維護成本居高不下等問題始終困擾生物島實驗室,并對中心節(jié)點科研平臺建設帶來挑戰(zhàn),所以達成資源的統(tǒng)一調(diào)度、計算協(xié)同以及統(tǒng)一運維等后續(xù)服務迫在眉睫。
“傳統(tǒng)架構阻創(chuàng)新,微服務容器助敏捷”伴隨云原生、人工智能、數(shù)字計算等創(chuàng)新科技的快速發(fā)展,傳統(tǒng)以資源為中心的應用部署模式很難滿足高效編排、快速迭代等需求,亟需在保障數(shù)據(jù)安全的基礎上建設微服務應用容器平臺?;谖⒎杖萜骷軜嬮_展協(xié)同挖掘分析、模型訓練、智能工具集成、知識庫集成等創(chuàng)新應用建設,為各級科研人員及第三方大數(shù)據(jù)人工智能企業(yè)提供多維度的科研創(chuàng)新服務。
云智深度融合科研云解決方案全面助力科研創(chuàng)新與業(yè)務智能
為更好解決生物醫(yī)學在科研創(chuàng)新與業(yè)務應用方面的諸多問題,浪潮云海深諳其中之道,推出了以云智一體為核心的科研云解決方案。該方案基于開放、融合、敏捷、智能的原則,按照集約建設、分層解耦、云邊協(xié)同的建設思路構建一套融合虛擬化、容器、人工智能和 PC的科研云平臺。
做到向上提供統(tǒng)一的服務目錄,將基礎設施、人工智能、邊緣計算、高性能計算等資源全面云服務化,為科研創(chuàng)新應用提供全棧云服務,高效解決伴隨平臺建設諸多問題的同時,讓生物醫(yī)學科研“落地有聲”。
云邊協(xié)同讓數(shù)據(jù)“少跑路”,處理效率突飛
為了更好解決科研平臺數(shù)據(jù)采集節(jié)點(子節(jié)點)在數(shù)據(jù)源單位的部署運維、資源調(diào)度以及協(xié)同計算等問題,浪潮云海在項目中采用了云邊協(xié)同的方案架構。 具體來說,實施該架構首先在每個數(shù)據(jù)源單位各部署一套浪潮InCloud Rail超融合平臺,提供數(shù)據(jù)采集、分析挖掘所需的算力和存儲支撐,優(yōu)先滿足數(shù)據(jù)本地化處理需求,實現(xiàn)數(shù)據(jù)“少跑路”。
各個子節(jié)點的超融合平臺由主心節(jié)點的科研云平臺統(tǒng)一納管,可實現(xiàn)跨地域、跨中心資源的統(tǒng)一調(diào)度、統(tǒng)一監(jiān)控、統(tǒng)一運維,實現(xiàn)對科研工作的數(shù)字化、智能化、一體化管控。與此同時,中心節(jié)點與各子節(jié)點形成“云邊協(xié)同”架構,可開展科研協(xié)同訓練,實現(xiàn)數(shù)據(jù)在不出子節(jié)點的情況下參與計算訓練。
此外,中心節(jié)點云平臺還提供了應用下發(fā)的能力,可以通過中心節(jié)點為各個子節(jié)點批量下發(fā)高效的臨床組學智能分析工具,大大提升了應用交付效率,高達30%以上。即云平臺中心節(jié)點承載統(tǒng)一的應用全局分發(fā)、管理、監(jiān)控、運維及運營等工作,子節(jié)點則承擔應用運行以及監(jiān)控日志收集、清洗等,數(shù)據(jù)處理效率提升。
高效融合AI與HPC,計算能力猛進
為了更好支撐生物島實驗室的基因測序、醫(yī)療影像三維重構、醫(yī)療圖像分析等HPC和AI應用,浪潮云海在本次建設的科研云平臺中融合了人工智能和HPC能力,總體算力超千萬億次,可用存儲空間大于 3PB,效率提速20倍之多,充分滿足生物醫(yī)學研究對計算分析、數(shù)據(jù)存儲的剛需。 此外,本次項目依托浪潮HPC集群管理平臺ClusterEngine,打通硬件運維、業(yè)務管理和應用性能分析,大幅提升集群的資源利用率和計算效率,針對基因測序方面應用場景可以將人和類似哺乳動物的全基因組組裝時間縮短到2天以內(nèi)。
基于浪潮人工智能平臺承載的醫(yī)療影像分析、AI輔助診斷等相關應用研究工作,高效支撐了生物實驗室海量的醫(yī)療影像數(shù)據(jù)計算,數(shù)倍提升了AI模型的訓練效率。
搭載微服務容器平臺,科研應用創(chuàng)新顯著
為了高效落地科研創(chuàng)新應用建設,本次部署的浪潮云海容器平臺基于微服務架構,通過多種應用編排模式集成各類資源,包括多節(jié)點數(shù)據(jù)的協(xié)同挖掘分析和算法模型訓練、智能工具集成、知識庫集成等創(chuàng)新應用;同時整合了第三方大數(shù)據(jù)及醫(yī)療人工智能企業(yè)智能應用等,形成了生物醫(yī)學大數(shù)據(jù)共享應用平臺,進一步實現(xiàn)數(shù)據(jù)、知識、技術協(xié)同創(chuàng)新。
目前,生物島實驗室科研云平臺已全面投入使用,已經(jīng)基于該平臺開展了高效的標準化生物信息分析、臨床多組學數(shù)據(jù)科研挖掘和臨床分子檢測智能解讀等工作。未來還將整合臨床醫(yī)學知識圖譜及人工智能技術,不斷覆蓋基因組學、代謝組學、蛋白質(zhì)組學、表觀遺傳學等多維度組學測序數(shù)據(jù),構建更完整的患者閉環(huán)數(shù)據(jù)鏈條,全面支持精準醫(yī)學大數(shù)據(jù)應用。
“浪潮云海提供的云智一體為核心的科研云解決方案,讓我們親眼見證了云智深度融合的巨大實力:不但保障了數(shù)據(jù)采集的高效穩(wěn)定,還幫助我們極大提升了算力水平和處理效率,更為科研應用創(chuàng)新邁出了堅實的一步?!鄙飴u實驗室方面表示。
浪潮云海作為智算操作系統(tǒng)核心引擎,未來將持續(xù)踐行“貼近客戶、實踐創(chuàng)新”的理念,不斷在實際需求場景中打磨優(yōu)秀的產(chǎn)品以及解決方案,為生物科研的數(shù)字化、智能化轉(zhuǎn)型提供更加堅實的云數(shù)智融合底座。