北京2022年12月19日 /美通社/ -- 在當前數(shù)字經(jīng)濟時代,隨著5G、AI、云計算等新興領(lǐng)域?qū)τ嬎懔康男枨笤鲩L,傳統(tǒng)的體系架構(gòu)面臨性能和功耗瓶頸,已無法處理更復雜、更多樣的數(shù)據(jù),難以滿足日益高漲的算力需求,異構(gòu)計算應需而生。作為算力突破的新抓手,異構(gòu)計算能夠提高算力和性能,降低功耗和成本,并具備多類型任務(wù)處理能力,在智算中心、云數(shù)據(jù)中心、邊緣計算等場景有著廣泛應用。
12月16日,由高效能服務(wù)器和存儲技術(shù)國家重點實驗室和開放計算中國社區(qū)聯(lián)合主辦的 “異構(gòu)計算研究與實踐”第七期開放計算技術(shù)沙龍在線上成功舉行,由CSDN直播,浪潮信息、央鏈等平臺轉(zhuǎn)播,超1.7萬人次觀看。本期沙龍由高效能服務(wù)器和存儲技術(shù)國家重點實驗室首席研究員葉毓睿主持,匯集來自南開大學、鴻鈞微電子、遇賢、數(shù)渡科技、矩向科技、澎峰科技等產(chǎn)學研用領(lǐng)域相關(guān)專家教授,圍繞智能異構(gòu)計算系統(tǒng)、芯片、超異構(gòu)計算架構(gòu)、互連技術(shù)(PCIe)、異構(gòu)計算軟件棧等話題,共同探討異構(gòu)計算的發(fā)展現(xiàn)狀與趨勢。
首先,主持人葉毓睿研究員在開場分享了高效能服務(wù)器和存儲技術(shù)國家重點實驗室最近的一些思考和觀點。他表示,我們面臨著算力多元化,需求猛增的情形,隨著摩爾定律的放緩,以及功耗墻、登納德縮放定律和阿姆達爾定律遭遇瓶頸,多元算力、異構(gòu)計算、邊緣計算、散熱技術(shù)和一切皆計算機的硬件重構(gòu)方向等趨勢和相關(guān)技術(shù)的研究和實踐,成為近些年來的熱點。
在主題演講環(huán)節(jié),南開大學教授、博士生導師李濤分享了“智能異構(gòu)計算系統(tǒng)研究及應用”。他指出,異構(gòu)計算已經(jīng)成為云計算和邊緣計算等各種場景中的主流計算模式,GPU的出現(xiàn)已經(jīng)使得這一模式得到快速發(fā)展和成功應用。以深度學習為代表的人工智能技術(shù)及其應用發(fā)展如火如荼,對以GPU為代表的異構(gòu)加速技術(shù)以及算力設(shè)備產(chǎn)生了更大的需求,并形成良性循環(huán)。隨著特定領(lǐng)域架構(gòu)和RISC-V開源硬件等技術(shù)生態(tài)日漸完善,異構(gòu)計算模式將會更好地實現(xiàn)“專業(yè)的硬件干專業(yè)的計算任務(wù)”,為新時代的智能社會和數(shù)字經(jīng)濟建設(shè)提供更好的算力支撐。
鴻鈞微電子產(chǎn)品工程部副總裁潘國振就“數(shù)據(jù)中心異構(gòu)計算探索”進行主題分享。他表示,異構(gòu)計算技術(shù)來自于真真切切的業(yè)務(wù)場景需求、為了解決某個算力問題而存在,而業(yè)務(wù)需求是復雜的,計算熱點經(jīng)常是不明確的,軟硬件之間的分割線更是模糊的,數(shù)據(jù)流的方向往往會出乎硬件人所料。所以需要深入一線業(yè)務(wù)調(diào)研軟件棧細節(jié),從全業(yè)務(wù)鏈路來找熱點、定方案、做產(chǎn)品。如果只是具備某種硬件技術(shù),硬往業(yè)務(wù)環(huán)境里面去套,可能會水土不服。 當然最好的辦法是從兩頭往中間走,一邊調(diào)研業(yè)務(wù)軟件棧,一邊深度打磨異構(gòu)產(chǎn)品,最終找到最佳的結(jié)合點。
隨著異構(gòu)計算在云計算、智能計算、邊緣計算等領(lǐng)域的應用不斷深入,復雜多變的應用場景和多樣化的算力形態(tài)也對異構(gòu)計算系統(tǒng)提出了更高的要求。數(shù)渡科技合作部總監(jiān)許勝分享了“異構(gòu)計算中的互聯(lián)技術(shù)應用與探討”。他表示,為了獲取高性能和高效率的計算能力,利用CPU、GPU、NPU、FPGA等類型計算單元構(gòu)建出具有多元化計算能力的算力平臺,這些計算單元之間通過異構(gòu)融合和協(xié)同工作,來共同滿足復雜場景下對計算的差異化需求。而統(tǒng)一的高速異構(gòu)互聯(lián)和高效的異構(gòu)資源管理系統(tǒng),將有助于提升不同算力單元之間的協(xié)同優(yōu)化,降低多樣性算力綜合應用的開發(fā)難度,充分發(fā)揮異構(gòu)計算系統(tǒng)架構(gòu)在靈活性、高效性等方面的特點優(yōu)勢。
對于異構(gòu)計算而言,“碎片化”是非常大的挑戰(zhàn)。遇賢副總裁、首席架構(gòu)師陳爭勝發(fā)表了“打破邊界,從芯片異構(gòu)到系統(tǒng)異構(gòu)”主題演講,他指出,面對異構(gòu)會帶來的“碎片化”挑戰(zhàn),需要更多精心設(shè)計的抽象層級,使得有效算力能夠最大化。從CPU的視角來看,存在多個層面的異構(gòu),首先是Die內(nèi)的異構(gòu),比如大小核的異構(gòu);再就是Chiplet或者說封裝內(nèi)的異構(gòu),比如CPU+GPGPU MCM封裝;還有系統(tǒng)層面的異構(gòu),如通過CXL總線構(gòu)建一個多xPU、多級存儲的“對等”計算系統(tǒng)。此外,如何打破多個層級的邊界進行聯(lián)合優(yōu)化,如何降低硬件異構(gòu)對軟件架構(gòu)的影響,也是一個值得關(guān)注的問題。以芯片原廠及系統(tǒng)廠商共同主導的異構(gòu)生態(tài),帶來了一次產(chǎn)業(yè)鏈價值重構(gòu)的機會。
關(guān)于未來計算架構(gòu)的演進,矩向科技CEO黃朝波進行了“新一代計算架構(gòu):超異構(gòu)計算”的主題分享。隨著人工智能和元宇宙等創(chuàng)新應用的爆發(fā),底層的計算能力需要千倍萬倍的提升。計算架構(gòu)從最開始的單核串行,走到多核并行;又進一步從同構(gòu)并行走到異構(gòu)并行;未來,會進一步走向超異構(gòu)并行。黃朝波指出,串行編程符合人類的思維,并行編程難度較大,異構(gòu)并行編程難度更大,超異構(gòu)并行編程更是地獄級難度。如何駕馭超異構(gòu),是成敗的關(guān)鍵,也是需要重點投入的方向。未來,大算力芯片需要實現(xiàn)算力的多個數(shù)量級提升,是現(xiàn)有三大芯片CPU、GPU、DPU功能的部分或全部融合,成為通用的超異構(gòu)處理器。超異構(gòu)處理器為算力網(wǎng)絡(luò)提供超高算力密度的基礎(chǔ)單元,是面向云計算、邊緣計算以及自動駕駛終端等復雜計算場景的通用、綜合、融合的單芯片解決方案。
在軟件棧方面,澎峰科技CEO張先軼分享了“異構(gòu)計算軟件棧的國產(chǎn)自主與國際化愿景”。他指出,異構(gòu)計算軟件棧作為底層硬件和上層應用的橋梁,可以擴展芯片的應用范圍,提升計算性能。國際主流芯片公司都投入大量資源建設(shè)異構(gòu)計算軟件棧,例如Intel oneAPI,NVIDIA CUDA-X等。國內(nèi)異構(gòu)計算芯片公司,要么在構(gòu)建自主的語言、工具鏈,要么采取兼容CUDA語言的方式。從用戶角度說,要么學習成本高,要么性能不佳。針對用戶期望的性能高、兼容多、使用便利等需求,澎峰科技采用開源共建的模式,推出高性能計算庫PerfMPL庫解決性能問題,跨平臺API編程PerfXAPI兼容更多硬件,PerfXPy科學計算平臺平衡便利和性能。
在最后的圓桌討論環(huán)節(jié),遇賢副總裁、首席架構(gòu)師陳爭勝,數(shù)渡科技合作部總監(jiān)許勝,矩向科技CEO黃朝波等嘉賓,共同就異構(gòu)計算軟硬件協(xié)同設(shè)計、如何實現(xiàn)不同加速器之間數(shù)據(jù)高效交互、超異構(gòu)計算架構(gòu)發(fā)展展望、如何發(fā)揮算力多元化的優(yōu)勢等議題進行了熱烈探討與交流,并和聽眾進行了深入的互動問答。