今年 1 月,一年一度的國際計算機學會地理信息系統(tǒng)國際會議 ACM SIGSPATIAL 如期召開。
會上,HERE 公司技術(shù)專家陳新(Xin Chen)教授發(fā)表了名為《HD Live Maps for Automated Driving: An AI Approach》(意為自動駕駛高精實況地圖:人工智能法)的主題演講。會后,記者對陳新教授進行了專訪,下文為采訪實錄:
問:陳新教授,最近您在 ACM SIGSPATIAL 大會上做了有關(guān)高清地圖的主題演講。我們希望您能向大家分享下自己在高清地圖上的經(jīng)驗。首先,請您談?wù)勛约涸?HERE 的工作。
陳新:我是高級自動駕駛部門的一名工程主管。我負責“高清感知”團隊,這一團隊的主要任務(wù)是自動化整個高清實況地圖產(chǎn)品的繪制過程,我們用的主要是機器學習和 3D 技術(shù),這些技術(shù)都是業(yè)內(nèi)最頂尖的。
問:您在 HERE 公司,特別是高度自動駕駛部門有多少年的工作經(jīng)驗?
陳新:圣母大學(University of Notre Dame)博士畢業(yè)后我就進了 HERE,在這里工作已經(jīng)超過 12 年了,剛來時這家公司還叫 NAVTEQ 。至于高度自動駕駛部門,幾年前它成立后我就過來了。來這個部門前我在研發(fā)干了幾年,隨后轉(zhuǎn)崗到平臺以及核心地圖部門工作了幾年。
問:您在圣母大學學的什么專業(yè)?
陳新:我碩士和博士都在圣母大學學習,專攻計算機科學與工程專業(yè)。
問:那么,怎么準確定義高精地圖?它和我們?nèi)粘J褂玫膶?dǎo)航地圖有什么差別?
陳新:傳統(tǒng)的導(dǎo)航地圖包含道路拓撲、道路中心線幾何形狀和道路級別屬性,一般我們稱其為道路模型,在高精地圖里這只能算三層中的一層而已。
高精地圖中還有一層是高清車到模型,它包含了車道拓撲數(shù)據(jù)、車道級別幾何形狀以及厘米級精度的屬性。最后一層被稱為高精定位模型,它由不同的功能組成,主要任務(wù)是為定位策略提供支持,將自動駕駛汽車指向高清地圖上的確切車道及縱向位置。
多了這兩層,地圖就能有更豐富且更精確的內(nèi)容。HERE 的高清實況地圖就是一項基于云端的服務(wù),它不但有多個高精度的映射層,還能持續(xù)升級以支持 ADAS、高度或全自動駕駛解決方案。
問:那么,自動駕駛汽車為何需要高精地圖?AI 不是已經(jīng)完虐人類了嗎?比如在圍棋上打遍天下無敵手的 Alpha Go 和圖像識別上超越人類的微軟深度學習技術(shù)。如果人類駕駛員都能借著普通導(dǎo)航來到一個陌生的地方,自動駕駛汽車為什么還要高精地圖呢?
陳新:高精地圖能救命。傳感器和 AI 永遠都不會致臻完美,它們也會犯錯,這代價我們可承受不起。有了高精地圖,我們就能通過減少誤差來化解風險。此外,高清地圖還能輔助路線規(guī)劃工作的完成,完全超越傳感器的“視力”范圍。
當然,高清地圖還能增強傳感器和 AI 的能力,幫助它們理解周圍環(huán)境,特別是在罕見及惡劣的環(huán)境下。眼下,大多數(shù)自動駕駛解決方案都將高清地圖看作傳感、感知和規(guī)劃的關(guān)鍵組成部分,而想用上豐富的高清地圖信息,車輛必須精確定位它在地圖上的位置,現(xiàn)有的 GPS 定位方案在精度上卻有些差強人意。想提升定位精度,就得把實時車輛感知與高清地圖進行結(jié)合。
問:打造高精地圖過程中會面臨什么挑戰(zhàn)?
陳新:高精度、全覆蓋、近實時刷新、量產(chǎn)可擴展性和地圖互操作性都是我們面臨的挑戰(zhàn)。此前,高精地圖從未大規(guī)模部署過,所以我們也是該領(lǐng)域的先行者。HERE 致力于與客戶及合作伙伴緊密合作,不斷進行產(chǎn)品迭代并完成高精地圖與自動駕駛系統(tǒng)的整合。
問:能詳細解釋下什么是可擴展性和互操作性嗎?
陳新:想在全球范圍內(nèi)繪制厘米級精度的高清地圖并保證實時數(shù)據(jù)更新在技術(shù)上難度很大而且成本超高。沒有哪家公司能承擔數(shù)據(jù)采集、管理,軟件、算法、工具、管道、工藝開發(fā)及運營的成本。
因此,我們必須拿出一個不拖垮公司還能輕松量產(chǎn)的解決方案。至于所謂的互操作性則指的是一套高精地圖滿足所有客戶/合作伙伴的胃口,因為為每個客戶定制不同的高清地圖太不現(xiàn)實了。別忘了,大家的自動駕駛解決方案都處在研發(fā)階段,軟硬件上的變化太快了。
問:面對這些挑戰(zhàn),你們都準備了哪些對策?
陳新:AI 是殺手锏,詳細來說就是計算視覺、3D 數(shù)據(jù)分析和機器學習等技術(shù)。將這些技術(shù)進行合理整合就是高清地圖繪制自動化的最佳方案。
問:你提到的這些技術(shù)也是自動駕駛行業(yè)的中流砥柱吧?
陳新:當然。我們用來搭建高精地圖的技術(shù)與自動駕駛傳感/感知技術(shù)其實是硬幣的兩個面。前者注重質(zhì)量,后者則注重實時性能。繪制地圖用到的傳感器比自動駕駛汽車搭載的更現(xiàn)金更復(fù)雜,成本也更高。
問:當下深度學習這個概念非?;鸨?,你們用了嗎?
陳新:深度學習我們也用到了,它是機器學習技術(shù)下的一個分類。我們用它來自動進行特征提取,比如道路標線、路牌、障礙和路上的大坑等,數(shù)據(jù)則來自車載圖像傳感器和激光雷達等。
問:深度學習和計算視覺技術(shù)是如何共存的?
陳新:深度學習能用來解決許多計算視覺問題,而且它有很強的可擴展性。與傳統(tǒng)計算視覺算法相比,它能實現(xiàn)更高的準確度。當然,前提是有充足的訓練數(shù)據(jù)和算力。如果訓練數(shù)據(jù)不太夠,計算視覺或機器學習也能搭把手。
問:HERE 會自行開發(fā) AI 技術(shù)嗎?
陳新:當然,我的團隊就在開發(fā)計算視覺、深度神經(jīng)網(wǎng)絡(luò)、機器學習和 3D 數(shù)據(jù)分析等技術(shù),而且它們都是業(yè)內(nèi)最尖端的。
問:為什么 HERE 不干脆收購現(xiàn)有 AI 公司、自動駕駛新創(chuàng)公司或平臺?將工作任務(wù)外包給它們也行。
陳新:我們的“秘方”就是自己的數(shù)據(jù)和對數(shù)據(jù)的挖掘能力,HERE 的數(shù)據(jù)集可是業(yè)內(nèi)獨一無二的存在??梢哉f,不斷進化以及與這些數(shù)據(jù)相關(guān)的特殊要求是我們數(shù)據(jù)挖掘與開發(fā)上的優(yōu)先級。
我的團隊為 HERE 的數(shù)據(jù)集開發(fā)最先進的定制化技術(shù)并為高精地圖提供優(yōu)化支持。借助 HERE 豐富的訓練數(shù)據(jù),我們能直接將現(xiàn)成的深度神經(jīng)網(wǎng)絡(luò)架構(gòu)準確度提升到 70%-80%。未來,借助專業(yè)技術(shù)和經(jīng)驗,這一數(shù)字還能再上浮 10%-20%。
我相信,AI 技術(shù)對地圖公司也至關(guān)重要,它是 HERE 公司知識產(chǎn)權(quán)庫的定海神針。光我自己就申請了 50 多份專利,而有的同事專利比我還多。HERE 的許多工程團隊也用到了 AI 技術(shù),我們團隊開發(fā)的機器學習平臺就要成為 HERE 內(nèi)部的 AI 助手,無論有沒有這方面的背景你都能用它訓練、提升、部署及分享自己的機器學習模型。
問:真有趣,你們團隊能人可真多。
陳新:是的。我手下主要有三類人:第一類是研發(fā)工程師,他們的算法需要不斷挑戰(zhàn)極限。第二類是軟件工程師,他們得用好這些算法并維護公共代碼庫。第三類則是生產(chǎn)工程師,他們要為 AI 軟件在云端或邊緣的運行搭建基礎(chǔ)設(shè)施和應(yīng)用。HERE 有許多博士級別的研發(fā)工程師,他們來自麻省理工、普渡和卡耐基梅隆等名校。
問:為什么還要在邊緣運行 AI 軟件?
陳新:我在 Boulder 還有個團隊專門做邊緣感知和定位的工作。他們的任務(wù)就是利用高清地圖為定位創(chuàng)造參考性實施方案。除了控制和規(guī)劃,這個團隊幾乎涉及了自動駕駛的所有關(guān)鍵部分,而且由于裝在消費級設(shè)備上,因此可生成 HERE Maplets 以升級高清地圖。
問:未來高清地圖的生成能全自動化嗎?一點手動操作都不需要了?
陳新:在不久的將來,手動工作依然相當重要,因為沒有計算視覺或機器學習是百分百完美的。我們需要手動審閱并修復(fù)相關(guān)問題,讓高清地圖達到應(yīng)有標準。同時,機器學習算法很依賴訓練數(shù)據(jù),而它們的生成還得靠人,我們需要人類加入反饋環(huán)路才能讓自動化的準確性更高。
問:繪制地圖時你們用什么傳感器?
陳新:我們有差分 GPS、慣性測量單元(IMU)、多款工業(yè)級的高清攝像頭以及激光雷達掃描裝置。差分 GPS 和 IMU 會參考圖像和激光雷達點云,同時我們也會從圖像和激光雷達中提取高清地圖屬性。此外,我們還會利用其他數(shù)據(jù)來源,比如衛(wèi)星、空中成像和眾包的傳感器數(shù)據(jù)。
問:我聽說,一些公司在自動駕駛解決方案中都沒用到激光雷達,你們?yōu)槭裁匆眠@種傳感器呢?它可比攝像頭貴多了。
陳新:是的,激光雷達想大規(guī)模部署不容易,它太貴了。不過整體趨勢它是在降價的,而且體積也在不斷縮小。因此我認為想讓高清地圖達到厘米級的精度,激光雷達必不可少。
眼下,計算視覺無法重構(gòu) 3D 世界,因此其精度無法保證。舉例來說,如果在 10 米內(nèi)誤差為 1 厘米,100 米開外誤差就 1 米了,反觀激光雷達傳感器,數(shù)百米開外精度也能達到 1-2 厘米的精度。
攝像頭也很重要,因為它能提供激光雷達沒有的彩色信息,廣視角和較長的探測距離也是其優(yōu)勢。大多數(shù)機器學習算法都是為 2D 圖像研發(fā)的,眼下 ADAS 和高度自動駕駛汽車都偏向攝像頭,而且基于攝像頭的實時功能探測試升級地圖的絕佳來源。
問:既然 AI 技術(shù)發(fā)展那么快,您怎么能保證 HERE 的技術(shù)就是業(yè)界最頂尖的?
陳新:教職工作讓我不得不快速更新自己的技能。2010 年以來,我一直在伊利諾伊理工大學和西北大學教授兩門 AI 課。隨著時間的推移,每門課的教學大綱都發(fā)生了巨大變化,因為每年我們都有新算法、新技術(shù)、新趨勢和新軟件。
問:能詳細說說您的 AI 課程嗎?
陳新:我有一門課程叫做“地理空間視覺與可視化”,在這門課上學生會在地理空間信息的上下文中學習計算視覺、大數(shù)據(jù)分析和機器學習。另一門課是計量生物學,這也是我博士論文的主題。這門課上學生通過面部、虹膜和指紋識別來學習 AI 技術(shù)。計量生物學是機器學習技術(shù)最成功的產(chǎn)品之一,而且它幾乎侵入了人類生活的方方面面,正推動機器學習走向規(guī)?;透哔|(zhì)量之路。不過,技術(shù)發(fā)展帶來的道德和隱私問題也對社會造成了重大影響。
我的教學理念是讓學生通過使用真實世界的數(shù)據(jù)來考慮現(xiàn)實世界的例子,并在課堂上解決現(xiàn)實世界的問題,從而在現(xiàn)實世界中學習機器學習。我想讓學生掌握這個不斷變化的行業(yè)所需的知識,經(jīng)驗和技能。
問:教職工作對你在 HERE 的事業(yè)有所幫助嗎?
陳新:當然。許多我的學生現(xiàn)在都成了 HERE 的同事。同時,教職工作也讓我和當?shù)卮髮W建立了良好關(guān)系,許多學員和博士生現(xiàn)在都在為 HERE 贊助的研究項目效力。
在自動駕駛行業(yè),伊利諾伊理工大學是僅次于卡耐基梅隆、斯坦福和加大伯克利的第四大黃埔軍校,我希望自己的課程能為自動駕駛行業(yè)的發(fā)展盡一份力。當然,這也是 HERE 的核心價值之一。據(jù)我計算,過去八年來有 1000 多名學生修過我的 AI 課程。
問:最后,我想問問,開發(fā)者社區(qū)是否能從你的工作中受益?
陳新:我們與開發(fā)者社區(qū)合作的方式多種多樣。舉例來說,我們提供過不少高精地圖樣本,同時還與一個有名的研發(fā)項目平臺合作,將高精地圖界面植入了它們的庫。此外,與大學進行正式合作也是家常便飯,至于各種挑戰(zhàn)和競賽更是必不可少。我期待著能有更多人才加入我們這個世界級團隊。