近日,大模型獨(dú)角獸智譜AI在北京證監(jiān)局辦理上市輔導(dǎo)備案,正式開啟上市進(jìn)程。智譜是第一家啟動(dòng)IPO上市流程的“大模型六小虎”,有望成為“AI大模型賽道第一股”。這標(biāo)志著資本市場(chǎng)對(duì)AI大模型技術(shù)價(jià)值的認(rèn)可,也折射出該技術(shù)正在加速?gòu)膶?shí)驗(yàn)室走向產(chǎn)業(yè)應(yīng)用。隨著大模型技術(shù)突破帶來(lái)的范式變革,其商業(yè)化潛力正通過(guò)自動(dòng)駕駛、智慧城市等垂直領(lǐng)域逐步釋放。
大模型(Large Model)是指基于深度學(xué)習(xí)架構(gòu)、參數(shù)量級(jí)突破千億級(jí)的人工智能系統(tǒng),具備強(qiáng)大的數(shù)據(jù)學(xué)習(xí)能力、多模態(tài)信息處理能力和泛化能力。它通過(guò)海量數(shù)據(jù)訓(xùn)練,能夠自主提取特征、優(yōu)化邏輯,并完成復(fù)雜任務(wù)。在自動(dòng)駕駛領(lǐng)域,大模型被用于整合感知、決策、規(guī)劃等核心環(huán)節(jié),推動(dòng)技術(shù)從“規(guī)則驅(qū)動(dòng)”向“數(shù)據(jù)驅(qū)動(dòng)”轉(zhuǎn)變。
根據(jù)應(yīng)用場(chǎng)景差異,大模型可分為三大類:
自然語(yǔ)言處理大模型:以GPT系列、LLaMA為代表,專注于文本數(shù)據(jù)的語(yǔ)義理解與生成。在自動(dòng)駕駛中,這類模型支撐車機(jī)交互系統(tǒng)的自然語(yǔ)言對(duì)話能力。
計(jì)算機(jī)視覺大模型:如BEVFormer、Swin Transformer,通過(guò)多視角圖像融合技術(shù)構(gòu)建三維環(huán)境感知能力,在自動(dòng)駕駛中用于障礙物識(shí)別與軌跡預(yù)測(cè)。
多模態(tài)大模型:整合激光雷達(dá)、攝像頭、毫米波雷達(dá)等多源數(shù)據(jù),實(shí)現(xiàn)從感知到?jīng)Q策的端到端優(yōu)化。
大模型的技術(shù)突破在于其“規(guī)模效應(yīng)”——當(dāng)參數(shù)規(guī)模超過(guò)1000億時(shí),模型性能會(huì)出現(xiàn)非線性躍升,例如特斯拉Dojo 2芯片通過(guò)23.5EFLOPS算力支撐FSD大模型訓(xùn)練,使系統(tǒng)誤判率降低60%。這種能力躍遷直接推動(dòng)自動(dòng)駕駛從“規(guī)則驅(qū)動(dòng)”向“數(shù)據(jù)驅(qū)動(dòng)”轉(zhuǎn)型,例如毫末智行DriveGPT大模型通過(guò)1.2億公里真實(shí)路測(cè)數(shù)據(jù)訓(xùn)練,在無(wú)保護(hù)左轉(zhuǎn)場(chǎng)景的通行效率提升40%,系統(tǒng)誤判率降低60%,接近國(guó)內(nèi)新基建項(xiàng)目的可靠性標(biāo)準(zhǔn)。

具體來(lái)看,大模型對(duì)自動(dòng)駕駛的賦能體現(xiàn)在三大核心維度:
感知環(huán)節(jié)
傳統(tǒng)模塊化方案依賴人工設(shè)計(jì)特征提取規(guī)則(如HOG特征、SIFT算法),難以應(yīng)對(duì)動(dòng)態(tài)場(chǎng)景變化(如施工路段、突發(fā)加塞)。大模型通過(guò)BEV與Transformer架構(gòu),將多傳感器數(shù)據(jù)編碼為統(tǒng)一特征空間,實(shí)現(xiàn)360度無(wú)死角環(huán)境建模。例如,百度Apollo ADFM通過(guò)10重安全冗余方案,在武漢復(fù)雜路況下的障礙物識(shí)別準(zhǔn)確率達(dá)到99.7%,接近中國(guó)國(guó)產(chǎn)大飛機(jī)C919的安全水平。
決策層面
端到端大模型打破“感知-決策-規(guī)劃”的鏈?zhǔn)郊軜?gòu),直接從原始傳感器數(shù)據(jù)輸出控制指令。這種技術(shù)路徑是模擬人類駕駛員的直覺判斷,例如在無(wú)信號(hào)燈路口場(chǎng)景中,模型能通過(guò)歷史軌跡數(shù)據(jù)學(xué)習(xí)到“等待3秒觀察對(duì)向車流”的博弈策略。特斯拉FSD V12突破性采用端到端大模型方案后,高速場(chǎng)景接管率下降80%,城區(qū)道路通行效率提升35%。
數(shù)據(jù)閉環(huán)
大模型推動(dòng)自動(dòng)駕駛進(jìn)入“車云協(xié)同”的正循環(huán):路測(cè)傳感器采集的動(dòng)態(tài)數(shù)據(jù)通過(guò)5G傳輸至云端訓(xùn)練平臺(tái),優(yōu)化后的模型再反哺車載系統(tǒng)。這種數(shù)據(jù)閉環(huán)能力使模型能快速迭代,特別是在我國(guó)大力支持智能網(wǎng)聯(lián)“車路云一體化”發(fā)展的背景下,大模型對(duì)自動(dòng)駕駛系統(tǒng)在真實(shí)場(chǎng)景下的進(jìn)化起到了關(guān)鍵推動(dòng)作用。
大模型研用:從產(chǎn)業(yè)鏈到終端
當(dāng)前,自動(dòng)駕駛大模型呈現(xiàn)“高端研發(fā)突破、量產(chǎn)逐步滲透”的格局。
在高端研發(fā)領(lǐng)域,從國(guó)內(nèi)到國(guó)外,從產(chǎn)業(yè)鏈到汽車主機(jī)廠,自動(dòng)駕駛相關(guān)企業(yè)均大力投入研發(fā),取得顯著成果。例如:地平線的UniAD模型、百度Apollo ADFM、小鵬汽車的BEV感知方案、Waymo的端到端多模態(tài)模型EMMA、特斯拉的FSD/Autopilot系統(tǒng)等,這些高端研發(fā)突破為自動(dòng)駕駛技術(shù)的進(jìn)一步發(fā)展奠定了基礎(chǔ)。
在量產(chǎn)方面,大模型的應(yīng)用正逐步滲透到商業(yè)化產(chǎn)品中。小鵬汽車的BEV感知方案支持無(wú)高精地圖的城市NOA功能,顯著提升了城市道路的通行效率;百度Apollo ADFM作為全球首個(gè)支持L4級(jí)自動(dòng)駕駛的大模型,在武漢蘿卜快跑中實(shí)現(xiàn)全天候無(wú)人化運(yùn)營(yíng),服務(wù)近半數(shù)市民。毫末智行的多模態(tài)大模型DriveGPT也在通過(guò)人駕自監(jiān)督學(xué)習(xí),在末端物流場(chǎng)景中不斷優(yōu)化其自動(dòng)駕駛系統(tǒng)。
在低速無(wú)人駕駛領(lǐng)域,已有多家企業(yè)率先在產(chǎn)品上應(yīng)用大模型,實(shí)現(xiàn)商業(yè)化落地,覆蓋了物流配送、清潔環(huán)衛(wèi)、安防巡檢等多類場(chǎng)景。
在無(wú)人配送場(chǎng)景,基于自主研發(fā)的自動(dòng)駕駛生成式大模型DriveGPT,末端物流自動(dòng)配送車毫末小魔駝3.0通過(guò)實(shí)現(xiàn)商超履約、安防巡檢等多場(chǎng)景切換,其無(wú)人配送車HD05 最高車速可達(dá)40km/h,能適應(yīng)全天候24小時(shí)配送需求。
九識(shí)智能在技術(shù)創(chuàng)新上,實(shí)現(xiàn)了將新能源車中普遍使用的車規(guī)量產(chǎn)固態(tài)雷達(dá)應(yīng)用到L4自動(dòng)駕駛車輛上,并通過(guò)雙目視覺及車規(guī)雷達(dá)的融合大模型感知技術(shù),實(shí)現(xiàn)了城市路況的高安全性高質(zhì)量產(chǎn)品能力。
新石器在最新推出的新石器無(wú)人車X12上搭載4D One Model 感知大模型,在順豐、京東的城配網(wǎng)絡(luò)中實(shí)現(xiàn)70km/h 高速行駛,夜間配送占比提升至65%。而美團(tuán)自動(dòng)配送車通過(guò)與清華大學(xué)合作開發(fā)安全強(qiáng)化學(xué)習(xí)算法,在離線狀態(tài)下避障通過(guò)率提高5%,百萬(wàn)公里事故率趨近于零。
在清潔環(huán)衛(wèi)場(chǎng)景,盈峰環(huán)境將DeepSeek大模型本地化部署并與自身200000+臺(tái)裝備運(yùn)行數(shù)據(jù)庫(kù)及億級(jí)公里作業(yè)里程數(shù)據(jù)融合,構(gòu)建起環(huán)衛(wèi)裝備行業(yè)最全最精的數(shù)字孿生矩陣,還在其第3代清潔機(jī)器人“小蜜蜂” 搭載AI智能技術(shù),可實(shí)現(xiàn)無(wú)人駕駛清掃作業(yè),并利用大模型實(shí)現(xiàn)環(huán)境動(dòng)態(tài)分析與決策優(yōu)化,推動(dòng)環(huán)衛(wèi)行業(yè)從傳統(tǒng)機(jī)械化向智能無(wú)人化重構(gòu)。
仙途智能無(wú)人駕駛環(huán)衛(wèi)車Autowise V1也全方位引入大模型技術(shù),在車云協(xié)同方面,通過(guò)集成最新的大模型技術(shù)實(shí)現(xiàn)車輛與云端平臺(tái)間的高效數(shù)據(jù)交互與智能決策協(xié)同,依托云端的強(qiáng)大算力進(jìn)行場(chǎng)景理解與策略優(yōu)化,顯著提高了無(wú)人駕駛系統(tǒng)在長(zhǎng)尾場(chǎng)景中的決策能力。同時(shí),仙途智能新一代1vN無(wú)人駕駛遠(yuǎn)程運(yùn)營(yíng)體系全面引入多模態(tài)大模型技術(shù)作為AI安全員。依靠先進(jìn)的多模態(tài)大模型技術(shù),AI安全員能夠?qū)囕v運(yùn)行過(guò)程中的相機(jī)圖像進(jìn)行實(shí)時(shí)處理與分析,識(shí)別出車輛行駛時(shí)遇到的危險(xiǎn)場(chǎng)景和異常情況,為無(wú)人駕駛提供安全保障。
酷哇科技在去年9月發(fā)布的麒麟無(wú)人駕駛清掃機(jī)器人上采用了以視覺為主的傳感器的360°全域感知方案,基于ViT大模型和千萬(wàn)級(jí)精準(zhǔn)的全要素?cái)?shù)據(jù),并結(jié)合占用柵格感知,實(shí)現(xiàn)了2D轉(zhuǎn)為3D的效果,確保了環(huán)境感知的準(zhǔn)確性。此外,酷哇科技將大語(yǔ)言模型的泛化理解能力同底盤控制與上裝相結(jié)合,做到了從掃刷、吸嘴到風(fēng)機(jī)、垃圾箱的全面線控化,而且確保核心零部件定向針對(duì)場(chǎng)景打造。
賽特智能“智賽潔”系列無(wú)人清掃車搭載在今年上海CCE展上演示了其所搭載的L4級(jí)自動(dòng)駕駛、具身智能系統(tǒng)以及環(huán)衛(wèi)大模型協(xié)同運(yùn)作的全過(guò)程。
在園區(qū)物流場(chǎng)景,西井科技無(wú)人駕駛商用車Q-Truck,搭載了高精度傳感器、先進(jìn)人工智能算法、定位和5G通信技術(shù),使其能夠在復(fù)雜的物流場(chǎng)景中自主導(dǎo)航、精確避障,確保行駛的安全與穩(wěn)定。同時(shí),Q-Truck加載端到端大模型技術(shù),獲得了更優(yōu)秀的自學(xué)習(xí)與自適應(yīng)能力。
在礦山場(chǎng)景,中國(guó)煤炭科工集團(tuán)煤炭科學(xué)研究總院于2024年4月發(fā)布“太陽(yáng)石礦山大模型”,推動(dòng)了礦山智能化轉(zhuǎn)型,在礦山無(wú)人駕駛等領(lǐng)域發(fā)揮了重要作用。
易控智駕聯(lián)合中科院自動(dòng)化所團(tuán)隊(duì)進(jìn)行基于大模型(包括但不限于語(yǔ)言大模型LLM、視覺語(yǔ)言模型VLM等)的礦山場(chǎng)景自動(dòng)駕駛行為決策算法相關(guān)課題研究,旨在增強(qiáng)礦山無(wú)人駕駛應(yīng)對(duì)復(fù)雜場(chǎng)景的能力。
向通用智能與產(chǎn)業(yè)協(xié)同演進(jìn)
當(dāng)前自動(dòng)駕駛大模型的技術(shù)路線呈現(xiàn)顯著分化,一是以特斯拉、百度為代表,堅(jiān)持 “端到端大模型 + 自有硬件生態(tài)” 的垂直整合路徑,目標(biāo)實(shí)現(xiàn)完全自動(dòng)駕駛。二是以 Waymo、Mobileye 為代表,采用 “大模型局部替代 + 規(guī)則引擎主導(dǎo)” 的混合架構(gòu),更注重安全性與研發(fā)效率。
未來(lái)隨著算力基礎(chǔ)設(shè)施的迭代升級(jí),無(wú)論是“車端算力爆發(fā)式增長(zhǎng)”還是“云端訓(xùn)練效率躍遷”的進(jìn)化,都將成為大模型落地的核心支撐。
在芯片上,隨著英偉達(dá)Thor(200TOPS)與地平線征程6(508TOPS)等新一代車規(guī)級(jí)芯片采用異構(gòu)計(jì)算架構(gòu),集成 GPU/TPU/NPU 多計(jì)算單元,較上一代芯片能效比大幅提升。這類芯片使端到端模型的實(shí)時(shí)推理成為可能,令自動(dòng)駕駛在更快速度內(nèi)完成環(huán)境建模與決策等的生成。
在云邊協(xié)同上,正在致力于構(gòu)建分鐘級(jí)數(shù)據(jù)閉環(huán)。在自動(dòng)駕駛中,邊緣端(如車輛本身或路側(cè)設(shè)備)能夠?qū)崟r(shí)采集和預(yù)處理感知數(shù)據(jù),然后將關(guān)鍵數(shù)據(jù)快速傳輸至云端。云端利用大模型進(jìn)行深度分析、學(xué)習(xí)和模型更新,并將更新后的模型或關(guān)鍵參數(shù)迅速推送到邊緣端,實(shí)現(xiàn)感知模型的持續(xù)優(yōu)化和快速部署。如星睿智算中心2.0通過(guò) 23.5EFLOPS算力,實(shí)現(xiàn)“數(shù)據(jù)采集-訓(xùn)練-部署”分鐘級(jí)閉環(huán),類似架構(gòu)已被特斯拉 Dojo 2.0(10 EFLOPS)與百度Apollo云(5 EFLOPS)采用,形成 “車端實(shí)時(shí)感知 - 云端批量訓(xùn)練 - 邊緣節(jié)點(diǎn)快速部署” 的立體算力網(wǎng)絡(luò)。
目前來(lái)看,通過(guò)自動(dòng)駕駛大模型實(shí)現(xiàn)“通用智能”與“產(chǎn)業(yè)協(xié)同”,是未來(lái)終極方向。
在通用智能突破上,特斯拉、DeepMind等企業(yè)正探索 “具身智能大模型”,賦予車輛類似人類的常識(shí)推理能力。例如,通過(guò)多任務(wù)訓(xùn)練使模型理解 “消防車?guó)Q笛需立即避讓”“施工路段需減速繞行” 等抽象規(guī)則,而非依賴特定場(chǎng)景的數(shù)據(jù)標(biāo)注。這類模型若突破,將使自動(dòng)駕駛系統(tǒng)適應(yīng)99%以上的長(zhǎng)尾場(chǎng)景,較當(dāng)前水平提升2個(gè)數(shù)量級(jí)。
在產(chǎn)業(yè)協(xié)同重構(gòu)上,隨著車路協(xié)同標(biāo)準(zhǔn)的完善,大模型將從單車智能向“車-路-云”協(xié)同進(jìn)化。百度Apollo的“ACE 3.0”系統(tǒng)已實(shí)現(xiàn)路側(cè)大模型(部署于交通信號(hào)燈)與車載模型的實(shí)時(shí)交互,在保定試點(diǎn)區(qū)域使路口通行效率提升40%,停車次數(shù)減少65%,這種跨設(shè)備的模型協(xié)同將開啟“全局最優(yōu)決策”的新范式。
結(jié)語(yǔ)
大模型正在重塑自動(dòng)駕駛的技術(shù)邊界,其價(jià)值不僅在于提升系統(tǒng)性能,更在于推動(dòng)整個(gè)產(chǎn)業(yè)從“功能堆砌”向“認(rèn)知進(jìn)化”躍遷。未來(lái)五年,隨著算力成本下降與數(shù)據(jù)閉環(huán)成熟,大模型將成為自動(dòng)駕駛從實(shí)驗(yàn)室走向規(guī)?;涞氐暮诵囊?。同時(shí),“車 - 路 - 云 - 網(wǎng) - 圖” 五位一體的新基建體系,將為大模型提供更豐富的場(chǎng)景數(shù)據(jù),加速 L4 級(jí)自動(dòng)駕駛從城市示范區(qū)向全國(guó)路網(wǎng)擴(kuò)展。
由低速無(wú)人駕駛產(chǎn)業(yè)聯(lián)盟、新戰(zhàn)略低速無(wú)人駕駛產(chǎn)業(yè)研究所主編的《2024-2025年中國(guó)低速無(wú)人駕駛產(chǎn)業(yè)發(fā)展研究報(bào)告》已正式發(fā)布,涵蓋細(xì)分場(chǎng)景市場(chǎng)規(guī)模、區(qū)域份額、技術(shù)水平、競(jìng)爭(zhēng)格局、發(fā)展趨勢(shì)等分析,歡迎后臺(tái)留言了解報(bào)告詳情!