北京2021年9月22日 /美通社/ -- 9月17日,在蘇州舉行的第四屆全球人工智能產品應用博覽會(AIExpo2021)上,浪潮發(fā)布了新版AIStation人工智能推理服務平臺,為快速發(fā)展的人工智能應用提供強大的服務管理支撐,并可統(tǒng)一高效調度多款國際國內領先的AI芯片的算力,幫助企業(yè)和智算中心充分發(fā)揮多元算力作用,加速AI應用場景落地。此次發(fā)布是為了應對日趨豐富的人工智能應用對多元化AI芯片算力的需求,以及智能計算中心日益復雜的異構計算資源管理調度挑戰(zhàn)。
浪潮AIStation是業(yè)界領先的人工智能開發(fā)服務平臺,可支持超過數(shù)千節(jié)點AI服務器的超大規(guī)模人工智能集群調度管理。基于容器化技術簡化算力調度過程,幫助用戶擺脫在大規(guī)模AI計算集群中進行算力選擇、算力適配等繁雜工作,提高調度效率。實現(xiàn)資源敏捷調配,使得資源利用率得以大幅提升;強大的平臺調度機制可以應對需求突發(fā)場景在幾分鐘內自動完成服務擴容;支持多源模型統(tǒng)一部署,模型部署時間從數(shù)天縮短到幾分鐘,從而實現(xiàn)業(yè)務快速上線。AIStation可支持百萬級高并發(fā)的大規(guī)模AI推理服務場景,服務響應平均延遲低于1ms。
當前,日趨豐富的人工智能應用對多元化AI芯片算力的需求激增,驅動人工智能計算系統(tǒng)向多元算力計算架構轉化。使用多種AI芯片的混合計算架構需求越來越多,這種需求在產業(yè)AI化、智算中心等大規(guī)模AI計算系統(tǒng)建設時更加迫切。然而,各種類型AI芯片的連接接入標準不同,用戶在使用多元AI芯片系統(tǒng)時會遇到系統(tǒng)適配、芯片驅動、互聯(lián)互通、功耗管理、安全傳輸、易用性等各類問題,給用戶在部署多元AI芯片算力系統(tǒng)時提出巨大挑戰(zhàn)。
針對當前多元化算力的應用困局,浪潮此次發(fā)布的新版AIStation推理服務平臺實現(xiàn)了對英偉達、寒武紀、昆侖芯、高通等6家國際國內廠商的12款AI和GPU芯片的多元算力支持。AI芯片可通過適配浪潮提供的AI芯片算力接入規(guī)范即可快速接入AIStation平臺,幫助用戶降低對多元AI芯片的使用和管理難度。AIStation平臺實現(xiàn)多元算力的統(tǒng)一管理及調度,為生產環(huán)境算力運行提供一致的監(jiān)管功能,對GPU、MLU、XPU等AI芯片的性能狀況、AI業(yè)務流量及響應延時進行實時監(jiān)控,并根據(jù)監(jiān)控數(shù)據(jù)進行分析、決策、執(zhí)行操作,實現(xiàn)服務算力的自動調節(jié)、自適應推理業(yè)務突發(fā)資源擴展需求。
AIStation是業(yè)界首個支持多元AI芯片算力的人工智能服務平臺,打通了多元AI芯片從接入、管理、調度、適配到應用的路徑,通過構建AI芯片算力接入規(guī)范實現(xiàn)多元算力的標準化管理,為產業(yè)AI化和智算中心建設提供高效便捷的AI算力調度,讓AI應用和AI服務更便捷,助力用戶充分使用多元算力實現(xiàn)AI技術創(chuàng)新和落地。目前,浪潮AIStation推理服務平臺已在諸多客戶獲得成功應用,在新基建、互聯(lián)網、金融、保險、交通、手機通信、智能汽車、智慧城市等多個AI場景發(fā)揮著重要作用。