1年融資超230億!計算機(jī)視覺為何如此吸金?

時間:2019-01-21

來源:創(chuàng)業(yè)家

0

導(dǎo)語:為了讓全行業(yè)對計算機(jī)視覺發(fā)展現(xiàn)狀有更清晰地了解,發(fā)布了《2018 中國計算機(jī)視覺行業(yè)報告》,我們采訪了多家計算機(jī)視覺領(lǐng)域的“獨(dú)角獸”企業(yè)與老牌技術(shù)大廠,并邀請多位專家從多角度對行業(yè)進(jìn)行深度解讀,希望這份報告能夠?yàn)樾袠I(yè)提供幫助并產(chǎn)生價值。

序 言

人的大腦分配了大量的資源用于視覺,對視覺的“投入”比聽覺、味覺、嗅覺多得多:40%-50% 的神經(jīng)元都與視覺功能有關(guān),在大腦頂層 IT 區(qū)尤為密集。相較于其他感官,人類使用眼的場景也更多,平均活躍時間也更多,視覺占據(jù)人類感官系統(tǒng)的 80%。

于是,看,是人類感知世界最直接的方式。

隨著技術(shù)的進(jìn)步,人類已經(jīng)不僅僅滿足于用自己的眼睛看世界、看宇宙,因?yàn)槿祟惐旧砩斫Y(jié)構(gòu)的局限性,有些東西是光靠人類的眼睛看不到的,所以人類開始研究如何教會機(jī)器去“看”。

計算機(jī)視覺就是這樣一門學(xué)科,用攝影機(jī)和計算機(jī)代替人眼對目標(biāo)進(jìn)行識別、跟蹤和測量等機(jī)器視覺,并進(jìn)一步做圖像處理,用計算機(jī)處理成為更適合人眼觀察或傳送給儀器檢測的圖像。

2016 年被很多人稱作人工智能的元年,但對于中國計算機(jī)視覺來說,2012 年開始,就已經(jīng)陸續(xù)出現(xiàn)了不少后來為人所熟知的 CV 初創(chuàng)公司,依圖科技、曠視科技等等都是在那一年創(chuàng)立的。

據(jù)調(diào)查,這些企業(yè)主要創(chuàng)立的時間都集中在 2015~2016 年前后, 2015 成為了視覺公司創(chuàng)立最多的一年,約有 80 家企業(yè)在這一年成立 。

從 2012 年到 2018 年,六年間,中國的國際機(jī)器視覺品牌已有近 200 多家,而中國自有的機(jī)器視覺品牌也已有超過 100 多家,機(jī)器視覺各類產(chǎn)品代理商超過了 300 家,專業(yè)的機(jī)器視覺系統(tǒng)集成商也有 100 多家,這些企業(yè)主要應(yīng)用于安防、金融、互聯(lián)網(wǎng)等方向。

2016~2017 年,也就是所謂的“人工智能元年”,中國的計算機(jī)視覺領(lǐng)域出現(xiàn)了一次明顯的分水嶺。在這一年的時間里,中國涌現(xiàn)出了一批優(yōu)秀的獨(dú)角獸企業(yè),根據(jù)《2017 年中國獨(dú)角獸企業(yè)發(fā)展報告》, 2017 年稱得上中國“獨(dú)角獸”企業(yè)的公司已達(dá) 164 家,這其中包括了 7 家人工智能企業(yè),而計算機(jī)視覺企業(yè)就在其中占了四個名額,他們分別是:曠視科技、商湯科技、云從科技與依圖科技 。

計算機(jī)視覺在這不到一年的時間里已經(jīng)遍地開花,地鐵的安防攝像頭、火車站飛機(jī)場的人臉識別閘機(jī)、智能手機(jī)的人臉識別解鎖與支付功能……不知不覺中,計算機(jī)視覺技術(shù)“滲透”到了人們生活的方方面面。

也同樣是這一年,中國計算機(jī)視覺領(lǐng)域的幾場數(shù)額巨大的融資活動,再一次吸引了世界的目光。被稱為人工智能領(lǐng)域最“吸金”的產(chǎn)業(yè), 計算機(jī)視覺在這一年獲得超過 230 億元的投資,在中國人工智能領(lǐng)域的投資當(dāng)中占比超過三分之一 。

為了讓全行業(yè)對計算機(jī)視覺發(fā)展現(xiàn)狀有更清晰地了解,發(fā)布了《2018 中國計算機(jī)視覺行業(yè)報告》,我們采訪了多家計算機(jī)視覺領(lǐng)域的“獨(dú)角獸”企業(yè)與老牌技術(shù)大廠,并邀請多位專家從多角度對行業(yè)進(jìn)行深度解讀,希望這份報告能夠?yàn)樾袠I(yè)提供幫助并產(chǎn)生價值。

第一章:2018 計算機(jī)視覺行業(yè)全回顧

1年融資超230億!計算機(jī)視覺為何如此吸金?

計算機(jī)視覺已經(jīng)成為變現(xiàn)最順利的人工智能技術(shù),根據(jù)中國信通院 2018 年 2 月發(fā)布的報告數(shù)據(jù),2017 年中國人工智能市場中計算機(jī)視覺占比 37%,以 80 億元的行業(yè)收入排名第一。

其中,安防影像分析是目前計算機(jī)視覺最大的應(yīng)用,2017 年占比約 67.9%,但目前新的應(yīng)用領(lǐng)域正在不斷創(chuàng)新涌現(xiàn),例如無人駕駛、醫(yī)療影像,但現(xiàn)在沒有大規(guī)模普及,都還是在初級階段。

作為落地應(yīng)用最廣的人工智能技術(shù),尤其在中國的發(fā)展如此之順利,主要有以下幾點(diǎn)原因:

第一, 深度學(xué)習(xí)的突破 。 深度學(xué)習(xí)是非常龐大的一個神經(jīng)網(wǎng)絡(luò),通過深度學(xué)習(xí),技術(shù)能做出非常好的結(jié)果來,雖然它不知道如何得出這個結(jié)果,但是它帶來的提升以及足夠 AI 技術(shù)從實(shí)驗(yàn)室真正走進(jìn)生活;

第二, 視覺場景極大豐富 。人類有 70-80% 的信息來源于視覺。相比語音場景的單一,CV 可以做的事情更多;

第三, 華人群體在全球范圍內(nèi)的崛起 。隨著中國的日益強(qiáng)盛,越來越多的留學(xué)生出國選擇計算機(jī)及相關(guān)專業(yè),將前沿的技術(shù)與研發(fā)理念帶回國內(nèi),這也客觀導(dǎo)致了在 AI 和 CV 領(lǐng)域,華人人才儲備的快速增長;

第四, 中國國家層面的重視 。中國在新興技術(shù)領(lǐng)域與國外的差距并沒有傳統(tǒng)領(lǐng)域那么大,非常有希望在中短期趕上其他國家,且 AI 技術(shù)是中國產(chǎn)業(yè)轉(zhuǎn)型升級的重要動力,所以國家從頂層部委到地方都十分重視 AI 技術(shù)的培育與發(fā)展,這就營造了一個非常好的發(fā)展環(huán)境。

2018 年,更多的技術(shù)得到應(yīng)用,更多的產(chǎn)品得到推廣,我們將從市場發(fā)展與技術(shù)進(jìn)步兩個方面進(jìn)行詳細(xì)解析。

市場發(fā)展

從整個計算機(jī)視覺行業(yè)發(fā)展的角度看, 縱觀中西計算機(jī)視覺發(fā)展,可以看到,中國與西方國家的演進(jìn)路線不同 。

國際上前沿的技術(shù)主要集中在深度學(xué)習(xí)的基礎(chǔ)研究層面,而中國的計算機(jī)視覺技術(shù)更傾向于產(chǎn)業(yè)落地。經(jīng)過了過去這些年的沉淀,中國已經(jīng)在人才、數(shù)據(jù)、場景和政策層面做了比較多的儲備,為中國計算機(jī)視覺技術(shù)的發(fā)展提供了豐沃的土壤。

尤其是在應(yīng)用方面。從全球范圍來看,計算機(jī)視覺領(lǐng)域一定要通過落地應(yīng)用才能推動學(xué)術(shù)的發(fā)展,而中國在這方面具有巨大的優(yōu)勢。

說到計算機(jī)視覺場景的落地,以及賽道的搶占,這都與技術(shù)是否突破工業(yè)紅線息息相關(guān)。

與其他 AI 技術(shù)一樣,CV 技術(shù)的突破也在促使兩個工具的產(chǎn)生:一個是 生產(chǎn)力工具 ,對傳統(tǒng)行業(yè)中的人力部分進(jìn)行替代,降本增效;另一個是 交互工具 ,帶來新的交互體驗(yàn)和應(yīng)用,形成新的應(yīng)用場景。

目前 CV 公司比較集中的技術(shù)賽道有: 人臉識別、自動駕駛、醫(yī)療圖像等 ,但目前而言, 商業(yè)化落地最快的還是人臉識別及其業(yè)務(wù)相關(guān)的一些技術(shù) ,比如銀行會用到人臉和自然場景下的 OCR(文字識別),還有浸入式大數(shù)據(jù)風(fēng)控,安防會用到人臉、人體、車輛與大數(shù)據(jù)分析等。

全球 CV 領(lǐng)域在發(fā)展方向上與國內(nèi)差別不大,但是行業(yè)落地的速度會有差距,國內(nèi)在人臉、自動駕駛等技術(shù)在安防及部分行業(yè)落地非???,這得益于政府的重視和政策的開放。

每年計算機(jī)視覺頂級會議上,來自中國的論文總數(shù)、最佳論文數(shù)量占比越來越高,中國計算機(jī)視覺學(xué)術(shù)團(tuán)穩(wěn)坐第一梯隊。同時,技術(shù)的落地應(yīng)用跑得快,往往也對這項技術(shù)提出了更多超前的、突破性的問題,倒逼技術(shù)向著創(chuàng)新的方向、領(lǐng)域突破發(fā)展,這些論文大部分都是來自于實(shí)際應(yīng)用對技術(shù)的推動。

技術(shù)發(fā)展

從技術(shù)角度來看,目前計算機(jī)視覺技術(shù)在醫(yī)療、教育、自動駕駛、零售、社區(qū)等多個領(lǐng)域都有不錯的發(fā)展,但人臉識別技術(shù)研發(fā)和落地情況是比較領(lǐng)先,因?yàn)槿四樖翘烊坏目缧袠I(yè)入口,每個行業(yè)都與人有關(guān),所以人臉識別順勢成為了最先商業(yè)化的技術(shù),而這一技術(shù)落地最為廣泛的領(lǐng)域,就是每個人生活都離不開的手機(jī)。

計算機(jī)視覺落地手機(jī)行業(yè)

2017 年,越來越多的手機(jī)廠商意識到了 AI 給智能手機(jī)行業(yè)帶來的價值,紛紛推出了自己的 “AI+ 手機(jī)” 。2018 年,主流手機(jī)廠商更是在各自的旗艦機(jī)型中全面引入 AI 技術(shù),甚至搭載 AI 芯片的手機(jī)正在成為市場的主流。

但是,同樣我們也看到,目前的“AI+ 手機(jī) ”還處在 較為初級的階段 , 很多的功能應(yīng)用還具有局限性,只是在部分特定場景下才能發(fā)揮作用,距離真正的“AI 手機(jī)”普及還有不小的技術(shù)門檻。

AI 對于智能手機(jī)的價值,是能夠提前預(yù)測用戶需求,主動給出相應(yīng)指引或回應(yīng),實(shí)現(xiàn)從 Smart 到 Intelligent,AI 解鎖僅僅是行業(yè)向前邁出的第一步。而視覺應(yīng)用是手機(jī) AI 應(yīng)用中最主要的訴求,主流的手機(jī) AI 應(yīng)用大多與視覺應(yīng)用相關(guān),可以說, 提升視覺技術(shù)是當(dāng)前是改善用戶體驗(yàn)最直接和最有效的手段,甚至已經(jīng)成為評判一款手機(jī)產(chǎn)品重要的指標(biāo)之一。

從技術(shù)上來看,計算機(jī)視覺技術(shù)在手機(jī)的應(yīng)用主要可以分為三大方向: 識別與認(rèn)證、AI 攝影、3D 視覺。 其中 3D 視覺 是手機(jī)視覺技術(shù) 最具潛力的應(yīng)用。隨著光學(xué)器件的提升,3D 視覺將原來平面的數(shù)字世界做到立體。

但目前 基于 3D 的視覺應(yīng)用還不普及,應(yīng)用、算法、 硬件、解決方案之間的技術(shù)壁壘還沒有完全打通 ,需要有更為簡單和高效的技術(shù)方案來進(jìn)行一站式的整合,需要產(chǎn)業(yè)生態(tài)進(jìn)行更深度的融合與協(xié)作。后文將會對 3D 視覺的核心技術(shù): 3D 結(jié)構(gòu)光 進(jìn)行更詳盡的解釋。

3D 結(jié)構(gòu)光: 3D 結(jié)構(gòu)光是獲取面部立體信息的最佳方案之一,它是通過人臉表現(xiàn)反射光線來確定深度信息的,主要用于終端人臉識別,如手機(jī)刷臉解鎖等。

結(jié)構(gòu)光聽起來很高大上,但實(shí)際上也很好理解,工作時相關(guān)器件會投影具備一定結(jié)構(gòu)的光,比如亮滅相間的條紋光線,如果打到平面上,那么反射回來會是原樣粗細(xì)的條紋;而如果打到不規(guī)則物體上,那么反射回來就會時條紋就會發(fā)生變化,然后根據(jù)計算,就能得出物體的結(jié)構(gòu)。

1年融資超230億!計算機(jī)視覺為何如此吸金?

目前 3D 結(jié)構(gòu)光技術(shù)在手機(jī)領(lǐng)域已經(jīng)得到了應(yīng)用,如:小米 8 透明探索版就是全球首款支持 3D 結(jié)構(gòu)光技術(shù)的安卓旗艦手機(jī)。

云端和嵌入式

人工智能需要大量的數(shù)據(jù),所以 AI 最早是往往是從云端起步的,但是隨著時間的推移,因?yàn)榘踩浴⑷诵曰男枨螅饾u地的會有一個遷移,很多的應(yīng)用會從云端遷移到終端,未來最常見的 AI 應(yīng)用模式,可能是在云端做訓(xùn)練、做培訓(xùn),最后在終端做執(zhí)行。可以說,在萬物互聯(lián)的時代,云端 AI 和嵌入式 AI 會是相互共存、相互補(bǔ)充的關(guān)系。

在靠近數(shù)據(jù)產(chǎn)生端進(jìn)行計算,將網(wǎng)絡(luò)、計算、存儲能力從云端延伸到網(wǎng)絡(luò)邊緣,也因此擁有低時延、本地性高、對貸款要求低等優(yōu)勢的新型計算模式。

人工智能強(qiáng)于人類的地方,在于它擁有并行處理能力,人工智能可以擁有多雙“眼睛”,去觀察這個世界并不斷自我提升。如果“眼睛”會思考,就減少了回傳大腦的“視神經(jīng)”的負(fù)擔(dān)。不必將全部數(shù)據(jù)都上傳至云端,減少了對網(wǎng)絡(luò)的負(fù)擔(dān),避免了網(wǎng)絡(luò)堵塞,提高了網(wǎng)絡(luò)帶寬利用效率,于是擁有上萬雙“眼睛”的人工智能成為了可能。

人才培養(yǎng)

對于技術(shù)行業(yè)來說,人才培養(yǎng)是非常重要的一環(huán),人工智能高準(zhǔn)入的技術(shù)門檻,決定了 AI 人才需要較長周期的培養(yǎng),所以當(dāng)人工智能產(chǎn)業(yè)迎來爆發(fā)的同時,造成了大量的人才缺口。

目前,中國高校培養(yǎng)的 AI 人才更側(cè)重于應(yīng)用層面,這與中國 AI 產(chǎn)業(yè)的特色密切相關(guān)。同時,大學(xué)開放的氛圍、校企合作提供的平臺,也使得這批人才在進(jìn)入企業(yè)后能夠快速成長,深入到行業(yè)中來。

相比之下,國外的 AI 人才更加偏向于基礎(chǔ)研究。但如今,中國 AI 人才也在基礎(chǔ)研究方面有了成果,在 CVPR、ECCV 等全球視覺頂會上,中國的 AI 人才也展現(xiàn)出了強(qiáng)勁的實(shí)力。

對于國內(nèi)計算機(jī)視覺相關(guān)企業(yè)的調(diào)查:社招人才由于其應(yīng)用方面的豐富經(jīng)驗(yàn),在招聘時會更加受到關(guān)注;而隨著大量畢業(yè)生對于人工智能企業(yè),尤其是初創(chuàng)企業(yè)的認(rèn)知不斷提升,校招人才的競爭力也有所提升。

從整體來看,AI 創(chuàng)業(yè)公司對專業(yè)人才的重視程度更高,專業(yè)人才代表了企業(yè)的核心實(shí)力,高質(zhì)量的人才能夠幫助公司獲得更強(qiáng)的市場競爭力。人工智能技術(shù)現(xiàn)在屬于增長期,此時人才是最稀缺的。未來 3-5 年內(nèi),人工智能領(lǐng)域最重要的競爭都是人才戰(zhàn),最頂級的懂算法的人才尤為重要,全球范圍內(nèi),人工智能領(lǐng)域突破性工作的研究人員數(shù)量及其有限,而 AI 競爭最核心的就是研究人之間的比拼。

一方面, 技術(shù)專業(yè)人才 能夠加速公司底層技術(shù)的突破;另一方面,企業(yè)對 應(yīng)用型專業(yè)人才 的需求同樣強(qiáng)烈。尤其是在針對不同的行業(yè)深入落地時,專業(yè)人才能夠協(xié)助企業(yè)更加精準(zhǔn)地完成技術(shù)與新場景的匹配,幫助企業(yè)快速進(jìn)入賽道。

此外,在人工智能領(lǐng)域做產(chǎn)品研發(fā),需要深入各個垂直領(lǐng)域,成為每一個領(lǐng)域的專家,所以人才也需要永遠(yuǎn)保持學(xué)習(xí)能力和好奇心,要善于思考、勇于創(chuàng)新,才能走在時代前列。

第二章:“獨(dú)角獸”的崛起

融資能力凸顯

2018 年對于計算技術(shù)覺初創(chuàng)公司來說可謂是“豐收”的一年。

4 月,商湯科技獲得 6 億美元融資,而就在此后不久,今年 5 月,商湯又獲得了 6.2 億美元的融資。

7 月,曠視科技拿下了 6 億美元的 D 輪融資,同月,依圖科技也獲得了 1 億美元的融資。

10 月,云從科技獲得 10 億元融資。

不到一年的時間里,這四家公司就已經(jīng)拿下了超 100 億元人民幣的融資,而根據(jù) CB Insight 數(shù)據(jù),2017 年中國 AI 創(chuàng)業(yè)公司的融資總額也不過 500 億人民幣(73 億美元)。

相應(yīng)的,這幾家公司的估值也隨著融資能力的上升而一漲再漲。

商湯科技目前估值已經(jīng)達(dá)到 45 億美元,云從科技估值達(dá) 33 億美元,曠視科技估值達(dá)到 35 億美元,依圖科技估計達(dá) 20 億美元。

當(dāng)然,除了這四家被“重點(diǎn)關(guān)注”的明星企業(yè),2018 年計算機(jī)視覺領(lǐng)域整體的融資水平都處在比較高的狀態(tài),據(jù)統(tǒng)計, 截至 2018 年 12 月,中國計算機(jī)視覺行業(yè)融資數(shù)額已達(dá)到 260 億人民幣,比去年整體高出近 30 億元 。

對于初創(chuàng)企業(yè)來說,融資能力當(dāng)然可以展現(xiàn)出一部分實(shí)力,而真正要從競爭中獲得認(rèn)可,還是需要靠強(qiáng)大的技術(shù)水平。

技術(shù)爭霸激烈

2018 年對于整個人工智能領(lǐng)域來說都是有些平淡的,甚至有人開玩笑說:2018 年 AI 領(lǐng)域最大的進(jìn)步就是毫無進(jìn)步。

對于計算機(jī)視覺領(lǐng)域來說是否也是同一番景象呢?

以上文所述的幾家初創(chuàng)公司為例。

商湯科技

提到中國的 AI 獨(dú)角獸,大概很少有人不知道商湯科技的。

從 2014 年成立至今,商湯科技也不過才走過四個年頭,2018 年 9 月,商湯科技被國家科技部選入國家新一代人工智能開放創(chuàng)新平臺的隊伍當(dāng)中,成為國家隊的一員。與之同列的是百度、阿里云、騰訊、科大訊飛等技術(shù)大廠。

據(jù)調(diào)查,商湯科技已與國內(nèi)外 700 多家公司和機(jī)構(gòu)建立合作,涵蓋智慧城市、智能手機(jī)、互動娛樂及廣告、汽車、金融、零售、教育、醫(yī)療、地產(chǎn)等多個行業(yè)。

此外,商湯科技自主搭建了深度學(xué)習(xí)平臺 SenseParrots,對超深的網(wǎng)絡(luò)規(guī)模、超大的數(shù)據(jù)學(xué)習(xí)以及復(fù)雜關(guān)聯(lián)應(yīng)用等支持更具優(yōu)勢。商湯科技還自主搭建了深度學(xué)習(xí)超算中心,大幅降低了各類人工智能技術(shù)的研發(fā)成本,并且縮短了開發(fā)深度學(xué)習(xí)算法模型的時間。

在今年,商湯科技促成了包括 SenseAR 美體塑形、SenseDriveDMS 駕駛員監(jiān)測、SenseMatrix 人臉 3D 重建等多個炫酷 AI 技術(shù)的落地。在智慧城市方面,商湯也加大了投入,據(jù)了解,商湯原創(chuàng)的 SenseSpace 智慧公共空間管理平臺已經(jīng)在黃浦江西岸正式落地并投入使用。

云從科技

2015 年 4 月,時任中科院重慶研究院智能多媒體中心主任的周曦正式創(chuàng)立云從。作為計算機(jī)視覺領(lǐng)域的“后來者”,云從的技術(shù)實(shí)力卻一點(diǎn)不弱。

2018 年,云從建立了包含人臉識別、跨鏡追蹤、車輛識別、姿態(tài)識別、語音識別、文字識別等智能感知技術(shù)和大數(shù)據(jù)分析、知識圖譜、人物畫像等認(rèn)知決策技術(shù)為核心的技術(shù)閉環(huán)。

今年 1 月,云從基于高準(zhǔn)確度人臉識別系統(tǒng)產(chǎn)業(yè)化及應(yīng)用,入選國家發(fā)改委“人工智能”創(chuàng)新發(fā)展工程;同年 9 月,依靠其自研的 SoC 芯片,云從入選工信部人工智能與實(shí)體經(jīng)濟(jì)深度融合創(chuàng)新項目;10 月,云從發(fā)布了國家發(fā)改委 “國家人工智能基礎(chǔ)資源公共服務(wù)平臺”項目,該項目啟動于 2017 年,由騰訊、百度、科大訊飛、云從科技四家承建。

云從科技是第一家同時承擔(dān)國家人工智能基礎(chǔ)平臺、人工智能應(yīng)用平臺和人工智能核心芯片平臺的人工智能企業(yè)。

目前,云從科技已經(jīng)成為中國銀行業(yè)第一大 AI 供應(yīng)商。包括農(nóng)行、建行、中行、招行總行等全國 400 多家銀行已采用公司產(chǎn)品,為全國銀行提供對比服務(wù)日均 2.16 億次。

在安防領(lǐng)域,云從的產(chǎn)品已在 29 個省級行政區(qū)上線實(shí)戰(zhàn),每天比對超過 10 億次,數(shù)據(jù)匯聚總量超過千億,協(xié)助全國公安抓獲超過 1 萬名犯罪嫌疑人;

在民航領(lǐng)域,已有 60 余家機(jī)場選擇云從產(chǎn)品,日均服務(wù)旅客超 6 千萬。

曠視科技

2011 年,曠視科技在北京成立。在計算機(jī)視覺獨(dú)角獸里,曠視算得上絕對的“老前輩”。除了是業(yè)界最早一批進(jìn)軍 AI 移動智能終端產(chǎn)業(yè)的人工智能企業(yè)之一,曠視科技也是手機(jī) AI 解決方案提供商。

曠視的核心 AI 技術(shù)應(yīng)用早已拓展到了手機(jī)行業(yè),基于核心的深度學(xué)習(xí)和計算機(jī)視覺技術(shù)推出人臉支付、人臉識別解鎖、人像光效、人像背景虛化、視頻美化、3D Animoji 等一系列移動端 AI 產(chǎn)品,以滿足不同手機(jī)廠商在人臉解鎖、圖像增強(qiáng)、相機(jī)增強(qiáng)、智能圖像和視頻處理上的需求,在不到一年的時間內(nèi)已經(jīng)與華為、小米、vivo、OPPO 等國內(nèi)頭部手機(jī)企業(yè)實(shí)現(xiàn)深度合作 。

2018 年,曠視在學(xué)術(shù)領(lǐng)域也收獲頗豐,全年先后發(fā)表 20 余篇 CV 頂會論文,并在 ECCV COCO 2018 一舉包攬四項冠軍。

在安防領(lǐng)域,曠視擁有全國最大的第三方人臉身份驗(yàn)證平臺。據(jù)了解,平臺涵蓋了全球 2.95 億人次的人臉信息,能夠提高在戶籍排查、重點(diǎn)場所管控、出入境管理和案件偵查等警務(wù)活動和國際會議、全球賽事等安?;顒拥陌踩?。也能將人臉身份驗(yàn)證平臺應(yīng)用于人臉識別支付、人臉識別解鎖、人像卡口系統(tǒng)等非安防領(lǐng)域中。

市場調(diào)研機(jī)構(gòu) WiseGuy Reports 發(fā)布的《2022 年全球面部識別市場預(yù)測報告》顯示,曠視科技成為中國唯一入選的人工智能企業(yè)。

依圖科技

依圖科技成立于 2012 年,深耕安防領(lǐng)域,維持金融業(yè)務(wù),大力布局醫(yī)療影像業(yè),在 2017 年,依圖科技獲封安防領(lǐng)域表現(xiàn)最強(qiáng)的算法型廠商。

2018 年,除了兩次上億美元級別的融資外,依圖科技的技術(shù)也同樣令業(yè)界矚目,尤其是在 AI+ 醫(yī)療領(lǐng)域。

今年 3 月,依圖推出世界首套 AI 醫(yī)療影像質(zhì)控系統(tǒng),可在在目前醫(yī)療影像缺少有效質(zhì)控手段的情況下,基于人工智能圖像識別技術(shù),通過海量數(shù)據(jù)訓(xùn)練,使醫(yī)院系統(tǒng)具備醫(yī)學(xué)影像成像質(zhì)量的自動評價與評分能力。

6 月 15 日,四川大學(xué)華西醫(yī)院與依圖醫(yī)療合作研發(fā)出國內(nèi)首個肺癌臨床科研智能病種庫和全球首個肺癌多學(xué)科智能診斷系統(tǒng)。

11 月,全球人臉識別算法測試(FRVT)上,依圖以以千萬分之一誤報下的識別準(zhǔn)確率超過 99%,成為冠軍。

第三章:大廠的發(fā)展

對于技術(shù)大廠來說,2018 年在計算機(jī)視覺上的發(fā)展是從多方面體現(xiàn)出來的。

以百度為例,計算機(jī)視覺 + 雷達(dá)的方案成為 Apollo 自動駕駛的首選,不僅在公園等封閉環(huán)境中已經(jīng)有了落地案例,百度還計劃 2020 年開始交付高速自動駕駛車輛,可解決包括直道彎道定速巡航、檢測車輛匯入、跟車行駛、前車剎車、拔桿變道等常見的駕駛問題。此外,百度在智慧城市方向也開始有所行動,為解決城市道路問題,百度突出了車路協(xié)同方案,在道路上安裝智能探頭用來監(jiān)控路況,通過 AI 實(shí)時反應(yīng)并處理突發(fā)情況。在智慧產(chǎn)業(yè)領(lǐng)域,百度的視覺技術(shù)也落地在醫(yī)療、制造等諸多產(chǎn)業(yè)當(dāng)中。

對于阿里巴巴來說,阿里巴巴視覺智能計算團(tuán)隊目前的重點(diǎn)在四個方向: 城市大腦,醫(yī)療 AI,工業(yè)視覺和智能設(shè)計 。其中“城市大腦”致力于通過云計算和人工智能技術(shù)去解決依靠人腦無法解決的城市治理和發(fā)展問題。圍繞這一目標(biāo),阿里巴巴目前的重點(diǎn)研究方向包括:多模態(tài)城市感知、交通預(yù)測與干預(yù)、并行異構(gòu)計算加速、基于視頻的行人與行為搜索識別、大規(guī)模城市視覺計算平臺等?;谝曨l的城市對象感知幾乎是所有工作的基礎(chǔ),也是阿里率先取得突破的技術(shù)方向之一。

而騰訊優(yōu)圖實(shí)驗(yàn)室在 9 月正式升級為騰訊計算機(jī)視覺研發(fā)中心,聚焦計算機(jī)視覺研究,專注在圖像處理、模式識別、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等領(lǐng)域開展技術(shù)研發(fā)和業(yè)務(wù)落地。在技術(shù)上,優(yōu)圖重點(diǎn)專注于圖像技術(shù)及人臉技術(shù)的研究及應(yīng)用探索。圖像技術(shù)包含圖像識別、智能鑒黃、OCR 技術(shù)、圖像分割以及超分辨率技術(shù)等。人臉識別包含人臉配準(zhǔn)追蹤技術(shù)、人臉核身技術(shù)、活體檢測技術(shù)、海量人臉檢索技術(shù)等。

目前優(yōu)圖 AI 技術(shù)已經(jīng)廣泛應(yīng)用在零售、工業(yè)、社交娛樂、社會公益、道路感知、金融、鑒黃、安防、醫(yī)療、政務(wù)等領(lǐng)域,在手機(jī) QQ、QQ 空間、QQ 音樂、微信、廣點(diǎn)通、全民 K 歌、騰訊覓影等產(chǎn)品中落地,并與滴滴、公安部門、快遞等行業(yè)已經(jīng)有了合作案例。其中,智能醫(yī)療和自動駕駛是該實(shí)驗(yàn)室今年剛涉足的領(lǐng)域。

第四章:懸而未決的問題

1年融資超230億!計算機(jī)視覺為何如此吸金?

計算機(jī)視覺是 AI 最為成熟的技術(shù)之一,其應(yīng)用已經(jīng)在政府、金融、互聯(lián)網(wǎng)等行業(yè)市場率先落地。但是,整體而言, 計算機(jī)視覺的應(yīng)用仍處于起步狀態(tài)。

當(dāng)前市場關(guān)注度、滲透率及技術(shù)采用度相對較高的應(yīng)用場景,如 人臉識別、物體識別、物體檢測等還停留在較為基礎(chǔ)的物體探測階段 ,在更具體的 事件檢測、更靈活的人機(jī)交互及更復(fù)雜的信息重組、自主行為等 方面的應(yīng)用明顯不足??梢哉f, 當(dāng)前的應(yīng)用僅是冰山一角。

此外,自 2018 年起,人工智能商業(yè)化落地也成為了全行業(yè)都在重點(diǎn)關(guān)注的問題,計算機(jī)視覺技術(shù)的商業(yè)化產(chǎn)品最多,但是在行業(yè)內(nèi)真正做到可以盈利的企業(yè)屈指可數(shù)。

與此同時,部分計算機(jī)視覺企業(yè)依靠競賽刷榜、刷分來現(xiàn)實(shí)自身實(shí)力,雖然可以通過這種方式獲得融資、招攬人才,但是對行業(yè)來說,落地才是硬道理。

在算法與硬件層,計算機(jī)視覺也同樣遇到了一些短時間內(nèi)無法解決的問題。

深度學(xué)習(xí)彌補(bǔ)了手工設(shè)計特征的缺陷,非線性變換可以做非常多次,特征表示能力顯著提高,并且可以自動地訓(xùn)練所有參數(shù),大幅提升了視覺算法的效率。但是,由于硬件方面如:設(shè)備外觀、電池容量、設(shè)計成本、供應(yīng)鏈等多方面的限制,算法無法在 端側(cè) 最大限度地發(fā)揮作用,導(dǎo)致了最終結(jié)果受到了一定的限制。

雖然目前在邊緣計算領(lǐng)域已經(jīng)有不少企業(yè)進(jìn)行了探索,但是要滿足大規(guī)模應(yīng)用的需求,尚需時日。

除了技術(shù)上的諸多問題外,2018 年的幾次重大的數(shù)據(jù)泄露事故,讓普通用戶更加在意道德層面的問題,首當(dāng)其沖的就是隱私安全性。

中國是人口大國,人口是一項巨大的優(yōu)勢,這也就決定了計算機(jī)視覺技術(shù)可以在中國取得更好的發(fā)展。但是,安裝在道路上的攝像頭、每個人手機(jī)上的鏡頭、行車記錄儀、家用安防攝像頭等等,都可以成為隱私泄露的窗口,此類消息在世界各地也屢見不鮮。

如何既滿足技術(shù)發(fā)展的需求,同時保證用戶在隱私方面的安全,這也是全行業(yè)仍在積極解決的問題。

總 結(jié)

相信 2019 年計算機(jī)視覺方面的落地與技術(shù)研發(fā),會更多的以人為中心來擴(kuò)展。人與物體的結(jié)構(gòu)化分析會成為主流,并且打通大數(shù)據(jù)分析這一環(huán),為客戶產(chǎn)生真正的價值,各個行業(yè)都會產(chǎn)生細(xì)分行業(yè)龍頭。頭部公司的行業(yè)特點(diǎn)會越來越鮮明,大家都會有自己側(cè)重的業(yè)務(wù)點(diǎn)。

當(dāng)然,在近兩年也會有一些企業(yè)在浪潮中退出歷史舞臺。

從技術(shù)發(fā)展的趨勢來看 ,現(xiàn)在是參數(shù)學(xué)習(xí),未來是結(jié)構(gòu)學(xué)習(xí),再以后是目標(biāo)學(xué)習(xí)。到那個階段,計算機(jī)視覺或許可以理解出來一些意料之外的能力。

從行業(yè)發(fā)展來看 ,視覺 AI 可以把整個生態(tài)環(huán)境形成起來。AI 并非一個獨(dú)立的行業(yè),它更像是一種為所有傳統(tǒng)行業(yè)提供變革契機(jī)的基礎(chǔ)設(shè)施。因此在未來, 具有核心平臺化能力的 AI 企業(yè)才能夠不被淘汰 。

從人才培養(yǎng)來看 ,就視覺領(lǐng)域來說,隨著 AI 的發(fā)展與普及,有更多的人才加入了學(xué)習(xí)計算機(jī)視覺技術(shù)的行列,但是大多數(shù)人還處在“正在進(jìn)行時”的狀態(tài)。行業(yè)需要真正有工程能力的人才,所以 人才短缺的情況仍會繼續(xù),還是需要時間來培養(yǎng) 。

隨著萬物互聯(lián)的物聯(lián)網(wǎng)時代的到來,AI 面臨著全新的發(fā)展機(jī)遇,與物聯(lián)網(wǎng)的結(jié)合將更為緊密。越來越多的物聯(lián)網(wǎng)設(shè)備接入網(wǎng)絡(luò),通過嵌入式模組、計算單元、感知單元等將物理世界數(shù)字化,獲取豐富的數(shù)據(jù),大大提升 AI 的感知能力,為 AI 奠定堅實(shí)的數(shù)據(jù)基礎(chǔ),讓充分的數(shù)據(jù)價值挖掘成為可能。

低速無人駕駛產(chǎn)業(yè)綜合服務(wù)平臺版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:低速無人駕駛產(chǎn)業(yè)綜合服務(wù)平臺]的所有文字、圖片、音視和視頻文件,版權(quán)均為低速無人駕駛產(chǎn)業(yè)綜合服務(wù)平臺獨(dú)家所有。如需轉(zhuǎn)載請與0755-85260609聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“低速無人駕駛產(chǎn)業(yè)綜合服務(wù)平臺”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注低速無人駕駛產(chǎn)業(yè)聯(lián)盟公眾號獲取更多資訊

最新新聞