2025年首場自動駕駛峰會,燃爆北京!
車東西1月14日消息,就在今天,由智一科技旗下智猩猩、車東西共同發(fā)起的第四屆全球自動駕駛峰會在北京中關(guān)村國家自主創(chuàng)新示范區(qū)展示交易中心-會議中心圓滿落幕。
作為智一科技面向自動駕駛領(lǐng)域打造的會議IP,第四屆全球自動駕駛峰會以“技術(shù)新周期 產(chǎn)業(yè)新征程”為主題,設(shè)置“主會場+分會場+展區(qū)”三個板塊。
其中,主會場進行開幕式、端到端自動駕駛創(chuàng)新論壇、城市NOA專題論壇;分會場則進行自動駕駛視覺語言模型技術(shù)研討會、自動駕駛世界模型技術(shù)研討會,全方位呈現(xiàn)全民智駕時代端到端自動駕駛新周期里的科研成果、技術(shù)探索、產(chǎn)品方案創(chuàng)新與未來趨勢。
整場活動,近30位自動駕駛學術(shù)領(lǐng)袖、產(chǎn)業(yè)大咖與青年學者齊聚一堂,共同探討了端到端、世界模型、視覺語言模型、城市NOA等行業(yè)內(nèi)最火熱的熱門話題。
▲主會場現(xiàn)場
現(xiàn)場嘉賓精彩觀點不斷,清華大學車輛與運載學院/人工智能學院教授、博導(dǎo)李升波認為車路云一體化是自動駕駛基座模型的開發(fā)框架,需要政府、企業(yè)、高校三者組建聯(lián)合體解決數(shù)據(jù)和算力等方面的難題。
理想汽車自動駕駛研發(fā)副總裁郎咸朋表示,理想汽車將致力于“人工智能的汽車化”,從模型、工程、產(chǎn)品等方面提升自動駕駛能力。
零一汽車智能駕駛合伙人王泮渠,昇啟科技聯(lián)合創(chuàng)始人、CTO劉敏俊,朗歌科技副總經(jīng)理李戰(zhàn)斌,都認為端到端帶來了研發(fā)模式的革新。
峰會全天有接近九百位觀眾來到現(xiàn)場。無論是主會場上下午,還是分會場的兩場閉門研討會,均是座無虛席。尤其是開幕式,場內(nèi)觀眾席兩側(cè)通道及后排空間更是站了不少觀眾。與此同時,20+媒體平臺與視頻號直播了本次峰會,直播觀看量超過百萬。
▲分會場-自動駕駛視覺語言模型技術(shù)研討會
▲分會場-自動駕駛世界模型技術(shù)研討會
作為2025年國內(nèi)首場自動駕駛峰會,本次會議不僅系統(tǒng)呈現(xiàn)了智能駕駛過去一年的發(fā)展態(tài)勢和量產(chǎn)進展,也為端到端自動駕駛開啟的新一輪變革指明了前進方向,也燃動了世界模型在國內(nèi)自動駕駛領(lǐng)域的研究與開發(fā)熱度。
一、智駕商業(yè)化迎來重要節(jié)點 端到端+大模型掀起行業(yè)新變革
峰會現(xiàn)場,智一科技聯(lián)合創(chuàng)始人、CEO龔倫常作為主辦方代表進行了開場致辭,他表示,過去一年,端到端與大語言模型、視覺語言模型協(xié)同,成為自動駕駛的主要技術(shù)路線。同時,世界模型也獲得了更高的關(guān)注。
▲智一科技聯(lián)合創(chuàng)始人、CEO龔倫常
基于此,峰會希望通過充分探討,梳理行業(yè)的發(fā)展現(xiàn)狀,進一步厘清未來的發(fā)展趨勢。
本次峰會圍繞端到端自動駕駛、城市NOA、自動駕駛視覺語言模型技術(shù)、自動駕駛世界模型技術(shù)等方向設(shè)置了多個話題。
數(shù)字化和智能化正在成為中國新一輪高質(zhì)量發(fā)展的重要驅(qū)動力,智一科技成立以來一直聚焦在這一驅(qū)動力背后的核心技術(shù)和行業(yè)需求,構(gòu)建了智東西、芯東西和車東西三大媒體品牌,持續(xù)提供專業(yè)優(yōu)質(zhì)的圖文和視頻內(nèi)容,在相關(guān)領(lǐng)域具有廣泛影響力。
同時,智一科技圍繞企業(yè)服務(wù),打造了智猩猩品牌,采用線上公開課和研討會等形式提供高質(zhì)量的技術(shù)向內(nèi)容。
在最后,龔倫常感謝了中關(guān)村科學城管委會對本次峰會的大力支持。
龔倫常致辭結(jié)束后,清華大學車輛與運載學院/人工智能學院教授、博導(dǎo)李升波率先登臺,分享了“數(shù)據(jù)驅(qū)動的端到端自動駕駛”發(fā)展歷史、關(guān)鍵技術(shù)與未來趨勢。
他首先回顧了人工智能領(lǐng)域的里程碑事件,包括2015年ResNET、2017年AlphaGo、2022年ChatGPT等,標志著人工智能時代的到來,并強調(diào),自動駕駛是人工智能的重要應(yīng)用方向之一,具有市場規(guī)模大、牽引鏈條長、技術(shù)難度高的特點。
▲清華大學車輛與運載學院/人工智能學院教授、博導(dǎo)李升波
緊接著,李升波指出,狹義上“自動駕駛”主要是指面向復(fù)雜城市交通工況的高級別智能駕駛系統(tǒng)。
這類系統(tǒng)對感知、決策、控制技術(shù)的安全性要求極高,因為控制權(quán)、風險監(jiān)控、失效應(yīng)對都是歸屬于系統(tǒng)本身處理,系統(tǒng)必須能夠獨立地完成所有駕駛?cè)蝿?wù)。
李升波表示,安全性不足是現(xiàn)有自動駕駛系統(tǒng)走向?qū)嵱没暮诵碾y題,典型指標是行駛過程的萬公里接管數(shù),還遠遠不能達到人類駕駛員的平均水平,核心難題在于如何處理邊緣駕駛場景(即發(fā)生數(shù)量的稀少,但危險度高的場景)。
為了解決這一問題,行業(yè)已經(jīng)形成的共識是:以數(shù)據(jù)閉環(huán)為基礎(chǔ),以神經(jīng)網(wǎng)絡(luò)為策略載體,走“端到端”自動駕駛的技術(shù)路線。
其目的是通過對邊緣場景數(shù)據(jù)的采集、上傳、清洗、訓練和部署,不斷優(yōu)化自動駕駛系統(tǒng)的行駛策略,達到邊開車邊學習,駕駛性能越來越好的效果。
李升波指出,端到端的本質(zhì)是“神經(jīng)網(wǎng)絡(luò)化”,而非只有一個黑箱的神經(jīng)網(wǎng)聯(lián)。
他介紹了端到端自動駕駛的技術(shù)優(yōu)勢,與傳統(tǒng)的分模塊設(shè)計相比,端到端的設(shè)計方案一方面能夠更有效地傳遞信息,減少信息損失,能夠充分挖掘數(shù)據(jù)資源潛力;另一方面具有更多的神經(jīng)網(wǎng)絡(luò)參數(shù),具有更大的訓練自由度,性能的上界更高。
李升波提到,我國科研機構(gòu)開展端到端自動駕駛的技術(shù)研究并不比國外晚,清華大學車輛學院的智能汽車團隊自2018年起就開始探索這一技術(shù)路徑。
他指出,六年前啟動這一技術(shù)的研發(fā),并不像今天具備這么好的條件,數(shù)據(jù)不足、算力匱乏都是制約模型訓練性能的挑戰(zhàn)性難題。
該團隊也是于行業(yè)內(nèi)率先提出“數(shù)據(jù)不足仿真補、算力不足算法超”換道研發(fā)思路,并于仿真軟件、AI訓練器等諸多方面取得了一系列重要進展,包括研發(fā)自主知識產(chǎn)權(quán)的大規(guī)模自動駕駛訓練軟件LasVSim和首個面向工業(yè)控制的最優(yōu)策略強化學習求解器GOPS。
李升波分享了清華大學在強化學習和神經(jīng)網(wǎng)絡(luò)訓練方面的研究成果,特別是針對穩(wěn)定性和效率的改進。
該團隊提出了強化學習領(lǐng)域性能排名第一的算法DSAC(Distributional Soft Actor-Critic),過擬合狀態(tài)動作價值的連續(xù)分布,等價學習了無限多個價值函數(shù),有效抑制了傳統(tǒng)強化學習僅擬合單值函數(shù)導(dǎo)致的過估計難題,較之已有強化學習算法性能大幅提升;研發(fā)了工業(yè)控制領(lǐng)域性能排名第一的神經(jīng)網(wǎng)絡(luò)優(yōu)化器RAD(Relativistic Adaptive gradient Descent),將神經(jīng)網(wǎng)絡(luò)參數(shù)的優(yōu)化過程建模為多粒子相對論系統(tǒng)狀態(tài)的演化過程,從動力學視角保障了強化學習的訓練穩(wěn)定性和收斂性。
以此為基礎(chǔ),清華大學成功開發(fā)出國內(nèi)首個三段式端到端自動駕駛系統(tǒng)iDrive,并率先完成城市工況的開放道路測試,這一技術(shù)方案后續(xù)成功在廣汽、東風、智行者等企業(yè)進行了實車部署,能夠在擁堵、無信號交叉口等城市復(fù)雜道路條件下實現(xiàn)非機動車讓行、路側(cè)停車繞行等行為。
最后,李升波展望了未來的發(fā)展方向,指出車路云一體化是自動駕駛基座模型的開發(fā)框架,亟需建立統(tǒng)一的數(shù)據(jù)平臺以促進數(shù)據(jù)共享,同時強調(diào)算力對自動駕駛的重要性,呼吁由政府、企業(yè)、高校三者組建聯(lián)合體共同解決這些制約自動駕駛發(fā)展的瓶頸難題。
李升波教授從學術(shù)的角度分享了對于自動駕駛的思考,理想汽車自動駕駛研發(fā)副總裁郎咸朋則站在了產(chǎn)業(yè)的角度,發(fā)表了主題為《理想自動駕駛技術(shù)創(chuàng)新應(yīng)用》的演講。
▲理想汽車自動駕駛研發(fā)副總裁郎咸朋
郎咸朋介紹了過去一年理想自動駕駛的研發(fā)進展。
理想汽車創(chuàng)新性地提出自動駕駛端到端+VLM雙系統(tǒng)架構(gòu),并結(jié)合基于世界模型的訓練評價體系,率先完成車位到車位的全量推送。而自動駕駛模型性能的提升同樣符合Scaling Law,基于1000萬clips訓練的模型即將推送用戶,全場景接管率(MPI)將超過100公里。
他表示,當前自動駕駛模型訓練總里程基數(shù)超過30億公里,云端算力超過8E Flops,下一階段將著重以創(chuàng)新技術(shù)手段提升資源利用效能。
郎咸朋還指出,從端到端+VLM到VLA,是AI能力從“行為智能”到“空間智能”的再次進階,后續(xù)理想汽車將著力于“人工智能的汽車化”,從模型、工程、產(chǎn)品三個維度提升自動駕駛的綜合能力。
為實現(xiàn)L3,全場景接管率(MPI)要超過500km,等效雙周一次接管,平均事故里程(MPA)要超過350萬公里,約等于人類安全里程的5倍,AD里程滲透率要大于25%,實現(xiàn)跨越鴻溝。
而要達到L4,這三方面的能力需要進一步提升至更高維度。
為實現(xiàn)L4,全場景接管率(MPI)要超過2500km,等效每季度一次接管,平均事故里程(MPA)要超過660萬公里,約等于人類安全里程的10倍,AD里程滲透率要大于60%。
郎咸朋在最后強調(diào),理想的使命愿景是成為全球領(lǐng)先的人工智能企業(yè),并以此為方向持續(xù)進行自動駕駛技術(shù)與產(chǎn)品的創(chuàng)新與應(yīng)用,還請大家拭目以待。
一些供應(yīng)鏈行業(yè)代表也分享了關(guān)于自動駕駛的一些思考。
元戎啟行副總裁、技術(shù)合伙人劉軒指出,當前的智能駕駛系統(tǒng)已擺脫傳統(tǒng)模塊化的規(guī)則驅(qū)動,轉(zhuǎn)向以AI為核心的數(shù)據(jù)驅(qū)動模式。
▲元戎啟行副總裁、技術(shù)合伙人劉軒
但現(xiàn)在的端到端智駕系統(tǒng)缺乏可解釋性,無法解釋它駕駛決策的邏輯。另外如果碰到難以用常識理解讀懂的情況,系統(tǒng)就很難推理出好的駕駛決策。
目前,元戎啟行正在研發(fā)VLA模型。實際上,VLA模型也屬于端到端框架,但和現(xiàn)在用的端到端模型不同。
VLA模型融合了VLM和E2E模型,對比上一代模型,VLA模型更簡潔,信息傳遞更直接,對于復(fù)雜場景的解讀更到位,可以更透徹地理解人類的駕駛文化。
最后劉軒表示相信很快智能市場就會迎來一個暴漲期。搭乘著市場的東風,元戎啟行也會全力沖刺。
極佳科技的副總裁毛繼明在演講中深入探討了生成式世界模型如何引領(lǐng)自動駕駛和具身智能走向新的時代。
當下,消費者對智能駕駛功能的體驗和要求不斷提高,這種高規(guī)格的要求使得智能駕駛算法的迭代面臨高質(zhì)量數(shù)據(jù)、低頻場景需求激增的困境。
為了解決這一問題,業(yè)界開始探索使用生成數(shù)據(jù)的可能性,以輔助提升算法性能。毛繼明指出,「生成數(shù)據(jù)」是世界模型的首要應(yīng)用之一,也是端到端自動駕駛最重要最高效的數(shù)據(jù)來源。
▲極佳科技合伙人&副總裁毛繼明
毛繼明強調(diào)智能駕駛算法的表現(xiàn)需超越人類駕駛員才能獲得人類司機的信任和使用。因此,構(gòu)建一個實時可交互的環(huán)境讓算法進行實踐顯得尤為重要,而生成式世界模型就負責構(gòu)建這個環(huán)境。
進而,毛繼明介紹了世界模型的基本概念,盡管目前尚無統(tǒng)一的定義,但業(yè)界的共識認為核心功能包括建模、想象、預(yù)測和行動。
世界模型是現(xiàn)實世界的投影,能夠為智能體提供想象能力、預(yù)測未來結(jié)果,并進行結(jié)果評判。毛繼明強調(diào),構(gòu)建世界模型的過程中,需要引入視頻生成、空間幾何和物理引擎等多種技術(shù),以實現(xiàn)更全面的世界建模。
在具體應(yīng)用方面,毛繼明提到,世界模型可以用于數(shù)據(jù)生成和泛化,通過生成多樣化的數(shù)據(jù)來提升感知算法的魯棒性,還可用于4D場景構(gòu)建,以支持實時閉環(huán)仿真等應(yīng)用。在此過程中,毛繼明展示了如何通過激活不同功能區(qū)來實現(xiàn)這些目標。
在演講的最后,毛繼明分享了極佳世界模型與合作伙伴落地的成功案例,展示了不同的模塊和功能在行業(yè)落地應(yīng)用的情況,以及極佳在此過程中積累的行業(yè)經(jīng)驗和“武器庫”。
毛繼明在演講中對生成式世界模型在智能駕駛和具身智能領(lǐng)域的突破性應(yīng)用進行了全面闡釋,并結(jié)合實際案例展示了極佳科技的技術(shù)成果。
正如他所強調(diào)的,世界模型并非僅是技術(shù)工具,而是推動未來人工智能邁向通用智能時代的核心引擎。通過融合視頻生成、空間幾何和物理引擎等多種技術(shù),世界模型不僅為算法的性能提升提供了高效的模擬環(huán)境,更為整個行業(yè)帶來了新的應(yīng)用可能性。
在未來的人工智能技術(shù)版圖中,世界模型的地位舉足輕重。它為實現(xiàn)高效、低成本的數(shù)據(jù)生成,增強智能體的預(yù)測與決策能力鋪平了道路。極佳科技致力于將世界模型的潛力進一步轉(zhuǎn)化為實際應(yīng)用,加速推動技術(shù)從專有領(lǐng)域向更廣泛場景的擴展,為通用智能的全面實現(xiàn)打下堅實基礎(chǔ)。
智加科技首席科學家崔迪瀟則從更細分的角度入手,圍繞走向更安全更智能的干線物流帶來了深入分享。
▲智加科技首席科學家崔迪瀟
崔迪瀟指出,中國的干線物流是一個萬億級別的巨大市場,卡車的存有量達到800萬臺。然而在這個巨大的市場背后,一系列結(jié)構(gòu)性的問題正日益凸顯。一方面,干線物流安全事故頻發(fā),另一方面,人力與燃油成本攀升擠占利潤空間,降本增效需求顯著。
針對這些痛點,智加科技始終堅持不懈地推進自動駕駛重卡的研發(fā)工作。目前,搭載智加領(lǐng)航系統(tǒng)的智能重卡已率先實現(xiàn)量產(chǎn),并且智加領(lǐng)航系統(tǒng)也已在頭部物流企業(yè)投入實際運營。
值得關(guān)注的是,崔迪瀟也就業(yè)內(nèi)盛行的端到端熱潮作出回應(yīng)。他指出,端到端在某種程度上可謂是一種資源“恐嚇”,尤其對于部分初創(chuàng)型企業(yè)而言更是如此。
與此同時,他也提到,盡管資源有限,但這些創(chuàng)業(yè)團隊同樣面臨著機遇。當技術(shù)發(fā)展至一定階段后,能夠以十分之一的成本達成同樣出色的效果。這是因為在端到端智能駕駛中,大量冗余的標注與計算實際上并無必要。
針對這些,智加科技提出了基于人類的駕駛駕駛指令來引導(dǎo)模型高效學習場景表征的SSR框架,成功實現(xiàn)了不依賴于感知標注的真正端到端訓練。
最后,崔迪瀟總結(jié)說:“L4級自動駕駛是我們的終極目標,在朝著這一目標前進的過程中,我們勢必會遇到各種變化和挫折,也會發(fā)現(xiàn)一些新的技術(shù)方向。不過,這些新的技術(shù)方向僅僅是我們實現(xiàn)目標的手段,而非目標本身。不能走了太遠,忘了為何而出發(fā)。為達成無人化這一目標,還有很多更重要的工作要大家一起堅持繼續(xù)去做。”
辰韜資本執(zhí)行總經(jīng)理劉煜冬博士從智能駕駛產(chǎn)業(yè)投資的角度,分享了關(guān)于端到端新范式下的智能駕駛產(chǎn)業(yè)投資思考。
▲辰韜資本執(zhí)行總經(jīng)理劉煜冬
劉煜冬表示,過去的半年整個行業(yè)有很大的變化,乘用車高階智駕滲透率接近10%,整個高階輔助系統(tǒng)向更低的車型滲透,智駕產(chǎn)品處于從早期市場邁向主流市場的重要拐點。
劉煜冬提到,目前端到端已經(jīng)不僅僅是一個技術(shù)名詞,破圈成為用戶體驗和用戶心智的一部分。
關(guān)于端到端范式加速演進,劉煜冬表示大模型將賦能VLM/VLA,提到端到端1.0是從規(guī)則到數(shù)據(jù)驅(qū)動,端到端2.0引入大模型和強化學習范式,會進一步強化數(shù)據(jù)帶來的壁壘,行業(yè)向車企和頭部智駕公司集中。
但是,劉煜冬表示端到端落地面臨著路采數(shù)據(jù)回灌開環(huán)驗證,實車性能差異大Sim2Real gap無法避免和Corner Case采集成本高、效率低等挑戰(zhàn)。
劉煜冬認為生成式世界模型成為端到端落地的重要工具,其可以充分利用海量的無標注數(shù)據(jù),包括互聯(lián)網(wǎng)數(shù)據(jù)、跨車型和傳感器參數(shù)的數(shù)據(jù)。還可以低成本生成高保真度的測試驗證數(shù)據(jù),用于端到端算法的閉環(huán)驗證。
端到端在乘用車輔助駕駛領(lǐng)域大放異彩,而在無人駕駛領(lǐng)域,2024年已經(jīng)是無人駕駛的商業(yè)化元年,諸多場景的無人駕駛公司開始了規(guī)模化復(fù)制和指數(shù)增長。
例如,易控智駕在礦區(qū)部署超 1000 臺無人車,Waymo在美國運營超千臺Robotaxi ,訂單量急劇增長。目前頭部無人駕駛公司也開始進行端到端的早期探索,更加關(guān)注新技術(shù)在L4無人駕駛降本增效和場景拓展的能力。
劉煜冬最后總結(jié)道,端到端自動駕駛2.0階段將開啟VLM/VLA的新范式,主機廠和掌握數(shù)據(jù)的自動駕駛公司進一步掌握話語權(quán)。
而隨著無人駕駛開始規(guī)模商業(yè)化,率先完成商業(yè)閉環(huán)的公司更有機會布局投入新范式,并擴展至更通用的無人駕駛開放場景。
而上午場嘉賓演講結(jié)束后,本次峰會也進入圓桌討論環(huán)節(jié),本次圓桌討論圍繞 “全民智駕時代開啟,端到端掀起新一輪變革” 的主題展開,在智一科技聯(lián)合創(chuàng)始人、總編輯張國仁的主持下,零一汽車智能駕駛合伙人王泮渠、辰韜資本執(zhí)行總經(jīng)理劉煜冬共同探討了自動駕駛領(lǐng)域在2024年的重要變化和未來發(fā)展趨勢。
與會專家普遍認為,2024年是自動駕駛商業(yè)化的重要節(jié)點。
▲圓桌討論現(xiàn)場
零一汽車智能駕駛合伙人王泮渠提到,wayve的技術(shù)進展和融資事件標志著端到端架構(gòu)的可行性,這為整個行業(yè)注入了信心。隨著無人駕駛技術(shù)的不斷成熟,多個領(lǐng)域如出租車、礦區(qū)無人駕駛、無人物流等開始實現(xiàn)商業(yè)化應(yīng)用,展現(xiàn)出良好的市場前景。
這一趨勢不僅促進了投資者的信心,也推動了相關(guān)企業(yè)的上市,標志著行業(yè)進入了一個新的發(fā)展階段。
論壇中,專家們強調(diào)了技術(shù)迭代和數(shù)據(jù)驅(qū)動對自動駕駛行業(yè)的重要影響。
辰韜資本執(zhí)行總經(jīng)理劉煜冬指出,自動駕駛行業(yè)正在從傳統(tǒng)范式向數(shù)據(jù)驅(qū)動的范式轉(zhuǎn)變,新的開發(fā)模式使得技術(shù)進步和產(chǎn)品落地的速度加快。尤其是人工智能技術(shù)的快速發(fā)展,為自動駕駛的實現(xiàn)提供了強有力的支持。
專家們認為,過去幾年的數(shù)據(jù)積累和技術(shù)創(chuàng)新為行業(yè)的快速迭代奠定了基礎(chǔ),使得自動駕駛的落地應(yīng)用得以迅速推廣。
在討論未來市場時,專家們認為自動駕駛領(lǐng)域?qū)霈F(xiàn)多種技術(shù)路線的共存。
王泮渠表示,盡管市場上有許多自研廠商,但第三方供應(yīng)商依然有生存空間。隨著市場規(guī)模的擴大,自動駕駛技術(shù)的滲透率仍在提升,為不同團隊提供了發(fā)展機會。
劉煜冬則指出,未來的商業(yè)化發(fā)展會更加依賴于技術(shù)的創(chuàng)新和應(yīng)用場景的多樣化,尤其是在物流和交通運輸?shù)阮I(lǐng)域,仍然存在大量未被開發(fā)的市場機會。
二、端到端革新智駕研發(fā)范式 掌握數(shù)據(jù)或掌握更多話語權(quán)
在今天下午峰會現(xiàn)場,主會場舉行了兩場論壇,分別是端到端自動駕駛創(chuàng)新論壇和城市NOA專題論壇。
在下午的端到端自動駕駛創(chuàng)新論壇上,中科院自動化所副研究員張啟超首先帶來主題報告,從科研角度講解監(jiān)督學習范式下端到端自動駕駛的新進展及其面臨的關(guān)鍵挑戰(zhàn)。
▲中科院自動化所副研究員張啟超
張啟超指出,2016年后端到端走向兩條路,一派是去做開環(huán)的端到端,然后另一派是做Carla仿真閉環(huán)的端到端。
他坦誠說,在2023年底的時候,他個人對于端到端自動駕駛能上車并沒有抱很大期待。而由于特斯拉一直在引領(lǐng)端到端的范式,再加上2024年其團隊也在與一些企業(yè)的合作過程中發(fā)現(xiàn),端到端在落地方面確實帶來很好的上限能力。
值得注意的是,在其團隊的科研實踐中,張啟超指出監(jiān)督式端到端自動駕駛存在規(guī)?;?,數(shù)據(jù)量的大規(guī)模增加帶來了兩方面的影響。
好消息是,Data Scaling帶來了“組合泛化”能力,數(shù)據(jù)規(guī)?;癁槎说蕉俗詣玉{駛提供了“組合泛化”能力,為自動駕駛安全落地提供理論支撐。
壞消息則是,閉環(huán)性能提升隨著數(shù)據(jù)量的指數(shù)增加有變緩趨勢。他指出,由于監(jiān)督數(shù)據(jù)拖后腿,隨著算力、模型增大,收益將飽和。
而對于成為業(yè)內(nèi)熱詞的“世界模型”,張啟超也給出了一些值得進一步探索的研究方向。
張啟超表示,端到端從開環(huán)走到閉環(huán),需要打造世界模型。
用途一是打造閉環(huán)測試驗證世界模型,把世界模型作為一個演練場,去評估和測試當前的端到端模型能不能上車。
用途二則是打造閉環(huán)世界模型用于RL策略訓練,即高保真的交互的世界模型,這也是一條不錯的路徑。
零一汽車智能駕駛合伙人王泮渠以《端到端+大模型: 加速新能源重卡智能化之路》為主題展開分享。
▲零一汽車智能駕駛合伙人王泮渠
王泮渠表示,輔助駕駛已經(jīng)進入量產(chǎn)狀態(tài),2023年,具備輔助駕駛功能的智能網(wǎng)聯(lián)乘用車銷量995.3萬輛,市場滲透率達47.3%,而目前,商業(yè)車對無人駕駛的需求還更高一些。
但是王泮渠提出,目前無人駕駛沒有走在軟件行業(yè)的商業(yè)模型上。
王泮渠以Waymo為例,表示其復(fù)制成本高、不同場景之間壁壘高,不具備通用性和跨越性。
而當前L4算法架構(gòu)的問題,有模塊過多且分散、泛化性較差、研發(fā)成本巨大和大規(guī)模產(chǎn)品化落地困難等。
那么如何解決?王泮渠表示零一汽車選擇了多模態(tài)大語言模型端到端。為什么選擇端到端?因為端到端框架簡易、泛化性強、成本有優(yōu)勢和量產(chǎn)友好。
關(guān)于如何保證大語言模型的安全性,王泮渠認為原理大語言模型的邏輯輸出可以被追溯,在算法上可以通過多模態(tài)對齊、生成對抗式學習和強化學習三種方法。
在流程上可以通過線下大規(guī)模開環(huán)與閉環(huán)仿真驗證,讓模塊快速進化。在系統(tǒng)上通過硬件與車輛冗余設(shè)計,讓系統(tǒng)更可靠。
王泮渠最后總結(jié)道,要做量產(chǎn)無人駕駛大模型是最優(yōu)路徑,量產(chǎn)自動駕駛一定需要量產(chǎn)車,車是一個平臺,可以百倍地下降自動駕駛的成本。
強泛化的算法,可量產(chǎn)的車輛,以及快閉環(huán)的場景是實現(xiàn)無人駕駛量產(chǎn)落地的必由之路。
以神經(jīng)網(wǎng)絡(luò)為載體的“端到端”自動駕駛規(guī)控方案,使得全棧模塊具備利用數(shù)據(jù)閉環(huán)進行快速更新的能力,這為高級別自動駕駛的智能性提升提供一條全新的技術(shù)路徑,昇啟科技聯(lián)合創(chuàng)始人、CTO劉敏俊登臺,對其一站式端到端自動駕駛研發(fā)平臺進行了深入解讀。
▲昇啟科技聯(lián)合創(chuàng)始人、CTO劉敏俊
劉敏俊表示,從2023年12月份以來,端到端已經(jīng)成為行業(yè)趨勢,而且在行業(yè)內(nèi)端到端整體的發(fā)展方式也變成主流。
其中,國內(nèi)企業(yè)動作較快,不管說是兩段式的還是一段式的端到端,甚至在組織架構(gòu)上面有很多的團隊有做了適配和調(diào)整。
他緊接著介紹了端到端的意義,端到端帶來的是研發(fā)模式的革新。
從之前的模塊化到現(xiàn)在的端到端一體化,一方面數(shù)據(jù)驅(qū)動的模式取代了以往的人工專家規(guī)則設(shè)計的范式,讓其信息傳遞產(chǎn)生的損失能夠大大減少,能夠保留的有效信息更高更完整。
另一方面在性能層面,端到端能夠通過數(shù)據(jù)驅(qū)動的方式去突破邊界,而在迭代速度和維護成本上也有一個極大的優(yōu)勢。
而在整個范式升級的過程中,其實核心的三要素就是數(shù)據(jù)、算法和算力。
圍繞這三要素,昇啟科技打造了一整套研發(fā)工具鏈,幫助主機廠完成端到端的模型開發(fā)。
昇啟科技自主研發(fā)的千行平臺,覆蓋數(shù)據(jù)生成、模型訓練、仿真測試以及模型部署等全棧功能,提供場景泛化、性能評估、數(shù)據(jù)挖掘、場景回放等開發(fā)工具,可實現(xiàn)大批量、自動化、高覆蓋度的端到端自動駕駛模型訓練。
目前千行平臺已服務(wù)合作多家企業(yè),幫助研發(fā)團隊完成數(shù)據(jù)驅(qū)動的AI能力建設(shè),實現(xiàn)自動駕駛端到端模型的落地,并在全國多個城市完成開放道路的實車測試驗證。
除了端到端一體化平臺的作用日益凸顯外,智駕地圖的重要性日漸提升,對此,朗歌科技副總經(jīng)理李戰(zhàn)斌博士則探討了智駕地圖在端到端時代的重要性,分析了其先驗知識與關(guān)鍵模態(tài)的應(yīng)用。
這場演講主要圍繞三個核心點展開:傳統(tǒng)地圖的局限性、端到端智駕地圖的構(gòu)建新范式,以及智駕地圖的未來進化方向。
▲朗歌科技副總經(jīng)理李戰(zhàn)斌
李戰(zhàn)斌首先指出,傳統(tǒng)地圖在自動駕駛領(lǐng)域的應(yīng)用存在明顯的局限性。當出現(xiàn)錯誤時,如何處理這些錯誤的維護成本高且周期長。
此外,傳統(tǒng)地圖的建圖周期較長,更新速度慢,容易導(dǎo)致事故隱患和通行效率降低。這些問題使得人們對地圖在智駕中的作用產(chǎn)生了誤解,認為其地位在下降。
隨后李戰(zhàn)斌提到,采用“影子模式”構(gòu)建的數(shù)據(jù)閉環(huán)系統(tǒng),能夠有效解決傳統(tǒng)地圖的不足。這種模式不僅提高了地圖的更新效率,還增強了其在復(fù)雜場景下的應(yīng)用能力。同時,智駕地圖作為一種先驗知識和新模態(tài),與傳感器的前融合范式,是解決地圖更新能力與覆蓋缺失不一致的高效解決方案。
最后,李戰(zhàn)斌指出,未來的智駕地圖構(gòu)建也將實現(xiàn)如系統(tǒng)一的端到端模型生成,智駕領(lǐng)航信息的生成也將如系統(tǒng)二的多模態(tài)大語言模型生成,出品質(zhì)檢與仿真檢驗也將可通過世界模型實現(xiàn)。
同時,智駕地圖OEM圖層云端編輯,將高效解決智駕cornercase,規(guī)避軟件和模型訓練的高成本和滯后性。
李戰(zhàn)斌提到,地圖在提供超視距感知能力方面具有獨特優(yōu)勢,能夠在傳感器受限的情況下,依然保證自動駕駛的安全性和可靠性,前融合的先驗?zāi)B(tài)將如同智駕大模型的提示詞,向智駕大模型輸入實例化的場景提示信息,實時增強模型并輸出更為準確和全局最優(yōu)的智駕規(guī)控信息。
總的來說,李戰(zhàn)斌博士的演講強調(diào)了智駕地圖在自動駕駛領(lǐng)域的重要性,指出其在傳統(tǒng)地圖應(yīng)用中的局限性,并介紹了端到端時代的新構(gòu)建范式及未來發(fā)展方向。隨著技術(shù)的不斷進步,智駕地圖將成為提升自動駕駛安全性和效率的關(guān)鍵要素。
三、車企重倉城市NOA量產(chǎn) 數(shù)據(jù)算法算力是關(guān)鍵
本次峰會的最后一個論壇是城市NOA專題論壇,城市NOA是當前各大車企重點投入的方向。北汽研究總院智能網(wǎng)聯(lián)中心專業(yè)總師林大洋從主機廠視角,對城市NOA量產(chǎn)應(yīng)用展開了分享。
▲北汽研究總院智能網(wǎng)聯(lián)中心專業(yè)總師林大洋
林大洋表示,NOA功能,尤其是城市NOA功能,能覆蓋更多用戶出行場景,是近期行業(yè)重點發(fā)展方向。當前,L3級自動駕駛正在推進試點準入,預(yù)計應(yīng)用場景聚焦在高速&快速路的單車道通行,中長期逐步覆蓋更多場景。
而“數(shù)據(jù)”、“算法”、“算力” 是驅(qū)動城市NOA的關(guān)鍵技術(shù)。林大洋指出,現(xiàn)在針對端到端方案,實現(xiàn)一個城市的量產(chǎn)需要的投入非常高。
同時他也指出,算法、算力和數(shù)據(jù)的突破將推動智能汽車由量變到質(zhì)變,未來車端通用大模型將整合座艙、智駕,實現(xiàn)“類人” 能力。
在最后,林大洋也介紹了北汽城市NOA的量產(chǎn)進展。北汽智能駕駛已量產(chǎn)產(chǎn)品覆蓋L2級ADAS系統(tǒng)到城市NOA。
為給駕駛者帶來更加智能、輕松且安全的駕駛體驗,北汽正加快BEV+OCC、端到端等智能駕駛核心算法的自研、建立數(shù)據(jù)閉環(huán)機制,通過構(gòu)建 “數(shù)據(jù)+算法+算力” 技術(shù)生態(tài)體系,聚焦關(guān)鍵技術(shù)自主可控,支撐北汽高階智能駕駛技術(shù)快速發(fā)展。
黑芝麻智能產(chǎn)品管理總監(jiān)周勇以“NOA走向普及,智能汽車“芯”平臺“芯”思考”從芯片方面對NOA進行了分享。
▲黑芝麻智能產(chǎn)品管理總監(jiān)周勇
周勇表示,半導(dǎo)體創(chuàng)新是每個技術(shù)變革時代的重要推動力,大模型的出現(xiàn)為汽車智能化帶來更多發(fā)展機會,大模型的演進給智能座艙交互和高階自動駕駛帶來明確的方向和道路選擇。
汽車智能化的關(guān)鍵是車載計算,黑芝麻智能致力于成為智能汽車計算芯片的引領(lǐng)者。
關(guān)于智駕技術(shù)的演進趨勢,周勇表示AI算法的快速演進對芯片的算力持續(xù)突破和架構(gòu)創(chuàng)新帶來驅(qū)動力;而高算力和創(chuàng)新架構(gòu)的車載計算SOC芯片反過來能推動汽車智能化向高階智能駕駛和無人駕駛發(fā)展。
關(guān)于NOA功能的進一步演進和落地,周勇表示將會有兩個方向,其中一種會以高速(含城區(qū)快速路)NOA普及為主,覆蓋的區(qū)域主要為區(qū)域高速/城區(qū)快速路。
另一方向是城市NOA,特點是場景復(fù)雜不確定性很高,第一階段覆蓋區(qū)域為城市主干道,第二階段覆蓋城市毛細路。
除了強大的算力基礎(chǔ)外,更優(yōu)秀的感知技術(shù)運用也在當下的智駕競賽中越來越重要,對此上海昱感微電子科技有限公司的創(chuàng)始人兼CEO蔣宏分享了多維像素多模態(tài)感知技術(shù)的應(yīng)用與發(fā)展。
▲上海昱感微電子科技有限公司的創(chuàng)始人兼CEO蔣宏
其演講主題為“多維像素多模態(tài)雷達融合技術(shù),構(gòu)建自動駕駛超級感知能力”,重點介紹了該技術(shù)如何提升AI系統(tǒng)的環(huán)境與事件感知能力,從而推動AI從計算智能向感知智能,再到認知智能的演進。
蔣宏首先指出當前自動駕駛市場的快速發(fā)展,他強調(diào),昱感微的產(chǎn)品定位在于為客戶提供“多模態(tài)感知融合技術(shù)“的方案以及對接的多維像素融合信號處理芯片,以更快地支持客戶完成智能感知的系統(tǒng)產(chǎn)品實現(xiàn)。
蔣宏介紹了“多維像素”的概念,指出該技術(shù)通過將不同傳感器的信息映射到可見光的圖像像素上,從而擴大感知的物理維度。通過時空對齊,這些傳感器的信息能夠有效地同可見光攝像頭圖像融合(完成像素級別的融合),為自動駕駛系統(tǒng)提供更全面的環(huán)境感知。
在技術(shù)實現(xiàn)方面,蔣宏展示了昱感微的原型機,強調(diào)了時空對齊在多模態(tài)感知中的重要性。通過對圖像和點云數(shù)據(jù)的融合,昱感微能夠?qū)崿F(xiàn)像素級的多傳感器融合感知精度,顯著提升自動駕駛系統(tǒng)的感知能力。
此外,蔣宏提到,昱感微的技術(shù)不僅在可見光條件下表現(xiàn)出色,在低光和復(fù)雜環(huán)境下也能有效識別目標。例如,遠紅外傳感器能夠在各種天氣條件下探測到目標(而且對人體識別場景有特別地針對性),為自動駕駛提供額外的安全保障。
蔣宏表示,昱感微的多維像素多模態(tài)感知技術(shù)通過將不同傳感器的數(shù)據(jù)融合在一起,能夠為自動駕駛系統(tǒng)提供更豐富的信息,提升其智能化水平。他表示,未來昱感微將繼續(xù)推動技術(shù)的進步,以滿足日益增長的智能駕駛需求。
全道科技CTO劉斌以“從1到10:新生態(tài)數(shù)據(jù)閉環(huán)重塑高階智駕”進行了分享。
▲全道科技CTO劉斌
劉斌表示,今天汽車行業(yè)的機會是數(shù)據(jù)驅(qū)動形成智駕技術(shù)代差,大算力與數(shù)據(jù)閉環(huán)成為勝負手。
在高級別智能駕駛方面,劉斌認為需要豐富和準確的數(shù)據(jù)才能做到車智能大于人工智能。
劉斌表示時空先驗數(shù)據(jù)在人可感知數(shù)據(jù)的視距范圍內(nèi)可以與感知數(shù)據(jù)融合,交叉驗證,提升可靠性。在車輛實時感知數(shù)據(jù)的視距范圍內(nèi)時空先驗數(shù)據(jù)可以彌補感知,增加可用性與體驗。
而時空先驗數(shù)據(jù)在視距范圍外可以提供超越人腦的記憶內(nèi)容、范圍、經(jīng)驗、大數(shù)據(jù)規(guī)律與臨時交通或事件干預(yù),同時提供人類世界的先驗規(guī)則,提高模型的安全底線,為駕駛安全兜底。
劉斌提出,車載端到端模型是“全國都能開”的終點,卻是“全國都好用”的起點。
劉斌認為,為了實現(xiàn)2025年NOA功能全國都好用,會分為端到端+先驗數(shù)據(jù)的借助先驗數(shù)據(jù)的NOA和借助VLM大模型的端到端+VLM兩條線路。
結(jié)語:全民智駕時代來臨
回望過去一年,自動駕駛迎來商業(yè)化重要節(jié)點,端到端被確立為行業(yè)趨勢,AI推動智駕體驗從“可用”向“好用”的突破,2025年L2+級別自動駕駛的國內(nèi)滲透率有望進一步提升,全民智駕時代已經(jīng)到來。