AI大模型或成未來數(shù)字經(jīng)濟的智能大腦

浪潮信息

2022-06-27 09:13 4360

北京2022年6月24日 /美通社/ -- 近幾年，“AI大模型”儼然是AI界的“當紅明星”，從國外的谷歌、微軟、英偉達，到國內(nèi)的浪潮信息、阿里、百度，都在不遺余力的布局AI大模型，而AI大模型的參數(shù)量更是屢創(chuàng)新高。

AI大模型究竟有什么魔力能吸引如此關注？AI大模型的產(chǎn)業(yè)應用價值有多大？產(chǎn)業(yè)化道路是布滿荊棘還是一路坦途？

近期，浪潮信息AI軟件研發(fā)總監(jiān)吳韶華博士和復旦大學管理學院張誠教授受財聯(lián)社邀請做客鯨平臺直播間，與財聯(lián)社科創(chuàng)板日報記者黃心怡就AI大模型與人工智能產(chǎn)業(yè)發(fā)展的關系展開了一場高端對話。

一訓多能的算法基礎設施

AI大模型的出現(xiàn)，讓很多產(chǎn)業(yè)人士認為這項技術會改變信息產(chǎn)業(yè)格局，即基于數(shù)據(jù)的互聯(lián)網(wǎng)時代、基于算力的云計算時代之后，將進入基于大模型的AI時代。在未來，人工智能像供水供電一樣流向終端，流向用戶、流向企業(yè)，誰能先做到這點，誰就會在AI產(chǎn)業(yè)布局中獲得先發(fā)優(yōu)勢。

什么是AI大模型？吳韶華博士從技術角度給出解釋，AI大模型是“人工智能預訓練大模型”的簡稱，包含了“預訓練”和“大模型”兩層含義，二者結合產(chǎn)生了一種新的人工智能模式，即模型在大規(guī)模數(shù)據(jù)集上完成了預訓練后無需微調(diào)，或僅需要少量數(shù)據(jù)的微調(diào)，就能直接支撐各類應用。例如浪潮信息于去年9月推出的2457億參數(shù)的大模型“源 1.0”，一個模型就能提供聊天、對話、知識問答、寫作等各類應用。

張誠教授從應用角度指出，大模型與訓練數(shù)據(jù)、預訓練等構成了AI的基礎架構，這種基礎架構即浪潮信息提出的“算法基礎設施”，在此基礎上，可以支持算法更高效地融入當前企業(yè)各類業(yè)務所使用的工具軟件，形成算法應用價值的商業(yè)變現(xiàn)。

大模型加速AI產(chǎn)業(yè)化進程

當前人工智能落地面臨長尾場景應用的“碎片化”和應用開發(fā)的“高門檻”等挑戰(zhàn)，而AI大模型是解決AI產(chǎn)業(yè)化應用痛點的一劑良方。

吳韶華博士提出，AI大模型將對AI模型的構建及應用產(chǎn)生極大影響，它會將傳統(tǒng)煙囪式的、碎片化的AI應用開發(fā)轉向集中式開發(fā)。一方面AI大模型具備很好的泛化能力，一個模型可以支撐各類不同應用，有效緩解碎片化開發(fā)反復建模的困境；另一方面，圍繞AI大模型構建的算法基礎設施，比如浪潮“源1.0”大模型開放的API、開源的應用代碼等，使開發(fā)者無需關心底層技術，設置無需配置編程環(huán)境，就可以直接將應用構建于AI大模型的能力之上，在降低開發(fā)門檻的同時，讓開發(fā)人員能夠將更多的精力聚焦核心業(yè)務邏輯。

張誠教授則認為，AI大模型代表了人工智能技術向產(chǎn)品化、產(chǎn)業(yè)化落地的趨勢，這個趨勢的持續(xù)發(fā)展會深刻改變產(chǎn)業(yè)格局。同時，人們對AI的認知、行業(yè)對其能力的評估都將越來越體系化。

AI大模型的“先天優(yōu)勢”為其加速AI產(chǎn)業(yè)化發(fā)展奠定了基礎。在數(shù)字經(jīng)濟的未來，AI大模型以及包含大模型在內(nèi)的人工智能模型，憑借優(yōu)秀的數(shù)據(jù)價值挖掘能力，較高的應用智能化水平，將會成為數(shù)字經(jīng)濟的智能化核心，甚至會成為數(shù)字經(jīng)濟中的智能大腦。

當然，AI大模型的發(fā)展也并非一蹴而就的。吳韶華博士指出，AI大模型的構建，首先需要大規(guī)模、高質量數(shù)據(jù)集的支撐，數(shù)據(jù)集的質量很大程度上決定了模型的質量。在大規(guī)模高質量數(shù)據(jù)集上，目前不但缺少相關配套軟件，也缺少數(shù)據(jù)集質量評測標準；其次還有模型算法以及訓練算力等方面的挑戰(zhàn)。張誠教授則認為，當前AI大模型和企業(yè)提升勞動效率需求的結合是最大的挑戰(zhàn)，也就是如何讓AI大模型在生產(chǎn)中真正發(fā)揮生產(chǎn)力作用。

挑戰(zhàn)只是暫時的，AI大模型代表了人工智能技術發(fā)展的方向。吳韶華博士和張誠教授堅信，AI大模型會在技術上產(chǎn)生更多的突破，也會對應用的規(guī)模化落地產(chǎn)生更好的促進作用。

采訪實錄

黃心怡：請談談對AI大模型的理解。

吳韶華：AI大模型的出現(xiàn)帶來一種新的現(xiàn)象，它將AI應用的開發(fā)從碎片化、煙囪式的開發(fā)，轉變成集中式開發(fā)，這種開發(fā)范式的變化，有望緩解當前人工智能落地難的問題，更好的賦能人工智能應用創(chuàng)新。

張誠：我們可以把人工智能到商業(yè)應用看成上下游的關系，上游對機器學習模型進行很好的預訓練，做成更扎實的“半成品”，幫助下游落時更好地把注意力放到商業(yè)問題的優(yōu)化上，這樣算法的商業(yè)應用就會更快、更有效。比如，AI大模型因為其自身具有的兼容性能適應更多場景，同時大模型做到了相對標準化，下游可以降低對算法的使用成本，以及和商業(yè)問題的適配成本。當然，企業(yè)對這種改變的適應也是影響大模型產(chǎn)生效果的重要影響因素。

吳韶華：浪潮信息將大模型看作算法基礎設施，這種基礎模型在算法層面的能力，還要聯(lián)合服務軟件才能在應用中發(fā)揮出來。因此，在應用支撐上模型和服務軟件共同形成一種類似于算法基礎設施的作用。

黃心怡: 您認為AI大模型的應用價值有多大？對于推進人工智能規(guī)模化落地能否起到作用？

吳韶華：首先是應用的碎片化，尤其是長尾場景應用的碎片化，是人工智能落地的難題。碎片化意味著不同場景需要有針對性的建模，每個小場景都要從數(shù)據(jù)到模型、應用整個流程走一遍。此外，隨著數(shù)據(jù)的更新，模型也要更新。設想下，對于一個維護上百個模型的企業(yè)，要同時更新上百個模型及應用，投入是巨大的。因為大模型具備比較廣泛的普適應用支撐能力，將傳統(tǒng)AI應用的煙囪式、碎片化開發(fā)轉變成集中式開發(fā)，很好的緩解了碎片化場景反復建模的現(xiàn)象。

其次，大模型也可以使研發(fā)人員聚焦在應用開發(fā)的核心要素上。在算法基礎設施層面，包括浪潮信息構建的源 1.0都是開源開放的，開發(fā)者不需要關心底層搭建的技術，就能直接調(diào)用源1.0的大模型能力。這種能力把AI應用的開發(fā)往上推了一大步，讓開發(fā)者聚焦應用最核心的業(yè)務邏輯，把跟模型相關的內(nèi)容放在模型層面或算法基礎設施的層面。比如，基于源1.0搭建的“劇本殺”游戲，可以直接復用源1.0的開源代碼，開發(fā)過程基本不需要寫代碼和調(diào)試代碼，就完成了整個應用的構建，此時，開發(fā)者能把更多精力放在劇情內(nèi)容等創(chuàng)意的創(chuàng)作上。

總結一下，大模型一方面會將AI應用的開發(fā)從煙囪式轉變到集中式開發(fā)，另一方面大模型降低了AI應用的開發(fā)難度，讓開發(fā)者能夠更聚焦在核心業(yè)務邏輯上，這是大模型給AI的應用落地帶來的兩大益處。

張誠：大模型和AI產(chǎn)業(yè)的發(fā)展是一個必然趨勢，對這種趨勢的未來判斷其實通過回顧信息技術的商業(yè)應用歷史來對照。上世紀90年代早期管理信息系統(tǒng)（MIS）剛開始在商業(yè)得到應用的時候，企業(yè)往往需要18個月到36個月才能完成信息系統(tǒng)的建設和流程的配合。但是到了最近二十年，相關產(chǎn)品越來越標準，3個月到12個月就能完成中等規(guī)模信息系統(tǒng)的設計和上線應用。從新技術發(fā)展來說，早期很重的項目定制化咨詢方式，到現(xiàn)在越來越多的系統(tǒng)以產(chǎn)品化、標準化的方式復制實施。

同時，現(xiàn)在越來越多的云服務被采納，算法基礎設施使得算法逐漸產(chǎn)品化、技術集中化，最終完成“標準產(chǎn)品”應用+二次開發(fā)的成熟模式。算法被標準化，應用或設置也可以標準化，那么人工智能應用的開發(fā)就不用從零開始做，時間也會大大縮短。同時，大模型的產(chǎn)品化、基礎化過程，讓企業(yè)智能化的成本越來越低，進一步促進人工智能產(chǎn)業(yè)的應用發(fā)展。

黃心怡：浪潮信息在實際應用過程中有沒有成本降低的案例

吳韶華：劇本殺就是一個典型的案例，在大模型出現(xiàn)之前，如果要做這樣一個游戲，需要很強大的模型，這個模型既要有對話能力，也要有邏輯推理能力，這對于模型的開發(fā)、數(shù)據(jù)的選擇門檻很高。

我們在源1.0開放過程中也遇到了很多類似情況，比如一個模型即可以支撐用戶的隨機閑聊，公文寫作，還可以支持一些特定場景的各類任務，這些在沒有大模型和算法基礎設施支撐之前，用戶需要有自己的算法人員，從頭開始收集數(shù)據(jù)、標注數(shù)據(jù)，然后做模型等，經(jīng)過一系列研發(fā)流程，最后才能走到最核心的業(yè)務邏輯上。

現(xiàn)在有了大模型，這些問題都可以得到很好的解決或者緩解，開發(fā)者不再關注底層算法基礎設施的構建，只要通過API就能獲得相應能力。所以大模型不管是從規(guī)?；?，還是針對單用戶的應用場景，都在成本方面有比較好的促進作用。

黃心怡：AI大模型的落地還存在哪些技術和應用瓶頸？

張誠：技術的應用在商業(yè)上要回答好兩個最基本的問題：投入產(chǎn)出比（ROI）和價值創(chuàng)造。

第一個問題涉及商業(yè)運營的基本利益原則：技術帶來的生產(chǎn)效率提升超過技術投入，企業(yè)才愿意去使用它。隨著技術成本不斷降低，達到收益-成本的均衡點后，自然會有越來越多的企業(yè)愿意接受，現(xiàn)在只是企業(yè)在等待均衡點到達的合適時間點。關鍵是第二個問題，涉及企業(yè)競爭優(yōu)勢和可持續(xù)發(fā)展的戰(zhàn)略問題，即企業(yè)究竟需要什么樣的AI可以產(chǎn)生超越競爭者的競爭優(yōu)勢。這個問題不完全是由技術決定的，而是由企業(yè)需求決定的。特別是實體企業(yè)，比如像制造業(yè)、傳統(tǒng)服務業(yè)，人在哪個地方做不好，哪個地方的生產(chǎn)效率或者轉換效率就會很低，如果用技術能夠解決、改變，技術與生產(chǎn)的結合就會非常重要。

假設把技術看成一種推動力，哪些業(yè)務場景是AI真正能夠緊密結合在企業(yè)流程里，能夠解決企業(yè)實際的生產(chǎn)需求或者某個決策需求，同時經(jīng)濟和社會收益都是值得去做的，那么AI大模型就能順利落地。所以，從應用的角度來看，大模型可能會遇到的瓶頸就是怎樣和實體企業(yè)的勞動效率提升和形成競爭優(yōu)勢這兩個需求結合起來。

吳韶華：大模型在技術上仍面臨著較大挑戰(zhàn)。首先大模型的構建過程中面臨大規(guī)模、高質量的數(shù)據(jù)集開發(fā)。數(shù)據(jù)集的質量決定了模型的質量，大規(guī)模的、高質量數(shù)據(jù)集的構建，是一個比較普遍的挑戰(zhàn)。不管是語言、文字等單模態(tài)數(shù)據(jù)，還是多模態(tài)數(shù)據(jù)，都面臨類似問題。

第一是在軟件及方法方面，業(yè)界缺少開源軟件，也缺少數(shù)據(jù)集構建和數(shù)據(jù)集質量評測的相關標準。我們在構建數(shù)據(jù)集的時候，基本上從零起步，從軟件、算法的角度構建了一個關于數(shù)據(jù)集的端到端開發(fā)平臺。多模態(tài)數(shù)據(jù)集更是如此，多模態(tài)數(shù)據(jù)可能會包含文字、圖象、語音、視頻等，它不僅需要原始數(shù)據(jù)，還需要對原始數(shù)據(jù)進行對齊，這更進一步增強了數(shù)據(jù)集構建的難度。大模型需要海量數(shù)據(jù)來做支撐，海量數(shù)據(jù)的收集本身就是一件比較有挑戰(zhàn)的事情。

構建數(shù)據(jù)集后，需要一個大規(guī)模集群來做訓練。以源1.0為例，在2128顆業(yè)界最先進的GPU集群上開展訓練。大規(guī)模集群算力的獲取就是一個比較大的挑戰(zhàn)。此外，怎么用好這個集群，加速訓練過程，進而降低算力成本開銷，也同樣充滿挑戰(zhàn)。

所以，從技術層面來講，大模型既有數(shù)據(jù)獲取，構建的挑戰(zhàn)，也有模型算法、訓練算力性能優(yōu)化的挑戰(zhàn)。

黃心怡：人工智能在數(shù)字經(jīng)濟當中發(fā)揮的價值？它的挑戰(zhàn)以及機遇有哪些？

吳韶華：大模型以及其他人工智能模型，將會是數(shù)字經(jīng)濟的核心支撐。一方面它可以很好的挖掘數(shù)據(jù)價值，另外一方面，在應用的智能化上也會發(fā)揮關鍵作用，大模型有可能會成為數(shù)字經(jīng)濟的智能大腦。

大模型帶來了很多新的機會，隨著技術的成熟，還會涌現(xiàn)更多機會。比如建模，AI大模型帶來的集中式建模能力將有效緩解碎片化應用開發(fā)的痛點。同時，大模型本身也能否孵化出新型應用，比如大模型具有很強的對話、交流能力，可以很好的賦能元宇宙的虛擬人場景。大模型對多模態(tài)信息的強大處理能力，也會孵化出來更豐富的多模態(tài)應用。

張誠：在過去的十年，更多的是人工智能和大模型的宣傳，嘗試，探索階段。接下來的十年會，對人工智能的應用會更好、也會更成熟，企業(yè)更懂得人工智能、大模型技術是什么、什么時候應用，同時還會很專業(yè)的評定收入產(chǎn)出比，評定人工智能對企業(yè)造成的成本增減，亦即獲得收益之間的平衡。當AI大模型的應用越來越成熟，我們就可以期待接下來每一年都比以前會更好。

黃心怡：總結一下您對AI大模型的一些思考

吳韶華：大模型將在技術上產(chǎn)生更多的突破，也會對應用的規(guī)模化落地產(chǎn)生更好的促進作用。

張誠：大模型代表了人工智能技術發(fā)展向產(chǎn)品化、產(chǎn)業(yè)化落地的趨勢，這個趨勢繼續(xù)下去，會更深刻改變產(chǎn)業(yè)的格局。

消息來源：浪潮信息