深圳2023年7月14日 /美通社/ -- 近日,以"智聯(lián)世界,生成未來"為主題的2023年世界人工智能大會(WAIC)在上海圓滿落幕。本次大會旨在搭建世界級合作交流平臺,共促發(fā)展新機遇。全球知名商業(yè)領軍者和全球創(chuàng)新先鋒云集于本次大會,闡述其對于新AI與新商業(yè)的見解,其中,加拿大工程院和加拿大皇家學院兩院院士、FATE開源社區(qū)技術指導委員會主席、微眾銀行首席人工智能官楊強受邀出席,分享了聯(lián)邦學習領域的前沿研學成果。
可信聯(lián)邦學習與聯(lián)邦大模型,解構大模型時代數(shù)據(jù)之困
7月7日,在由世界人工智能大會組委會辦公室主辦,中國信息通信研究院承辦,中國信息通信研究院華東分院、中國信息通信研究院云計算與大數(shù)據(jù)研究所協(xié)辦的"聚焦·大模型時代AIGC新浪潮"論壇上,楊強發(fā)表了"可信聯(lián)邦學習與聯(lián)邦大模型"主題演講。
在大模型迅猛發(fā)展的當下,對算力、數(shù)據(jù)量的極高要求是橫亙在中小型機構AI應用之路上的一道難以跨越的鴻溝。正如OpenAI CEO Sam Altman所言,未來模型參數(shù)應該向更小的方向發(fā)展,或者以多個小模型協(xié)作的方式工作。
楊強指出,聯(lián)邦學習(Federated Learning)能夠聯(lián)合分散的數(shù)據(jù)、分散的算力,可應用于解決可用數(shù)據(jù)量不足的問題,從而使多方共建大模型基礎設施,為業(yè)界提供了前瞻性的解決方案。當前,F(xiàn)ATE(Federated AI Technology Enabler)開源社區(qū)已經(jīng)發(fā)布了開源的聯(lián)邦大模型功能模塊FATE-LLM,支持各參與方的敏感數(shù)據(jù)不出本地域的前提下,根據(jù)各方實際數(shù)據(jù)量進行算力投入,聯(lián)合進行大模型訓練。未來,聯(lián)邦大模型架構將重點發(fā)展同構與異構聯(lián)邦大模型、大模型指導小模型聯(lián)邦等方面,進一步提升聯(lián)邦大模型的可用性、易用性。
在聯(lián)邦學習整體研究與產(chǎn)業(yè)落地方面,楊強介紹,"可信聯(lián)邦學習"(Trustworthy Federated Learning)作為安全可信的多方分布式機器學習范式,具有安全可信、高效可用、可管理、可審計、普惠等核心特征,將更加適配當前產(chǎn)業(yè)發(fā)展所需綜合考慮數(shù)據(jù)安全、隱私保護與效率的要求。同時,楊強介紹了可信聯(lián)邦學習最新的前沿研究與應用成果,包括質效均衡的可信聯(lián)邦學習算法框架,在金融反洗錢等行業(yè)場景中的應用等。
攜手共建聯(lián)邦學習開源生態(tài),推動數(shù)據(jù)要素安全流通
7月8日,在由世界人工智能大會組委會辦公室主辦,機器之心承辦的"AI開發(fā)者"論壇上,楊強重點作"可信聯(lián)邦學習與開源生態(tài)"主題分享,重點介紹了隱私計算和聯(lián)邦學習開源社區(qū)與生態(tài)。
據(jù)楊強介紹,開源已成為隱私計算技術規(guī)?;钠渲幸粋€重要途徑。FATE開源社區(qū)是由聯(lián)邦學習技術開發(fā)者、行研方、產(chǎn)業(yè)方及生態(tài)伙伴共同組建與治理的協(xié)作創(chuàng)新平臺,相關參與方可以基于工業(yè)級聯(lián)邦學習開源框架FATE探索聯(lián)邦學習技術的研究與應用。FATE開源社區(qū)以"開源開放,共力創(chuàng)新"為愿景,匯聚了4000+社區(qū)用戶參與社區(qū)共建,覆蓋金融、醫(yī)療、科研、人工智能等多個領域與場景,不僅已成為全球領先的聯(lián)邦學習開源社區(qū),還是可信數(shù)據(jù)流通領域最具影響力的社區(qū)之一。
在建立行業(yè)標準、推動應用場景方面,F(xiàn)ATE開源社區(qū)的成員單位共同牽頭建立了多項聯(lián)邦學習技術標準,落地了在企業(yè)跨主體的大數(shù)據(jù)協(xié)作、企業(yè)異構平臺互聯(lián)互通、多中心醫(yī)療發(fā)現(xiàn)等多場景下的聯(lián)邦學習應用實踐,共同打造了包含數(shù)據(jù)提供方、模型提供方、業(yè)務提供方、價值中介方等各環(huán)節(jié)緊密結合的數(shù)據(jù)要素流通生態(tài)。
談及未來發(fā)展趨勢,楊強認為聯(lián)邦學習與開源生態(tài)將成為隱私計算、機器學習和數(shù)據(jù)科學發(fā)展的關鍵驅動力。其中,可探索的重點包括進一步完善聯(lián)邦學習安全機制;推動跨平臺的互聯(lián)互通;推動數(shù)據(jù)確權與定價和模型交易;基于"模型和數(shù)據(jù)集水印"技術的模型審計和模型全生命周期管理;推動聯(lián)邦學習與大模型、區(qū)塊鏈等技術的融合等方面,為未來的智能時代提供核心支持。