
數(shù)據(jù)對(duì)人工智能產(chǎn)業(yè)的良好發(fā)展的必要性
通過這些發(fā)展政策我們可以發(fā)現(xiàn)的是,人工智能正在成為數(shù)字經(jīng)濟(jì)的核心驅(qū)動(dòng)力。作為國(guó)家“新型基礎(chǔ)設(shè)施建設(shè)”之一的人工智能,已經(jīng)運(yùn)用在智慧城市、交通、家居、醫(yī)療、金融和教育等各個(gè)領(lǐng)域。但其實(shí)在目前階段,人工智能落地亟需高質(zhì)的數(shù)據(jù)來完成算法訓(xùn)練,數(shù)據(jù)越多、越精準(zhǔn),落地的AI應(yīng)用也就越智能、越好用,可以說人工智能產(chǎn)業(yè)的發(fā)展離不開數(shù)據(jù)的支持。
提到AI數(shù)據(jù),不得不提在AI數(shù)據(jù)質(zhì)量方面擁有豐富交付經(jīng)驗(yàn)的頭部企業(yè)——云測(cè)數(shù)據(jù)。云測(cè)數(shù)據(jù)自建的數(shù)據(jù)標(biāo)注基地和場(chǎng)景實(shí)驗(yàn)室,以及專職數(shù)據(jù)服務(wù)人員的規(guī)范化管理和硬實(shí)力的技術(shù)投入,是數(shù)據(jù)高質(zhì)量交付的硬性保證;內(nèi)部完善的數(shù)據(jù)作業(yè)協(xié)同流轉(zhuǎn)體系,在保證數(shù)據(jù)質(zhì)量的同時(shí),可大幅提升數(shù)據(jù)作業(yè)的生產(chǎn)效率;文字、圖片、音頻、視頻等全品類數(shù)據(jù)處理能力、獨(dú)立第三方的身份和對(duì)數(shù)據(jù)隱私安全的嚴(yán)格把控,讓眾多 AI 企業(yè)和各個(gè)行業(yè)的龍頭企業(yè)選擇與云測(cè)數(shù)據(jù)保持著長(zhǎng)期良好的合作關(guān)系。
垂直行業(yè)數(shù)據(jù)需求各有不同,高質(zhì)量是共同點(diǎn)
以前文提到的智能駕駛舉例,智能駕駛多應(yīng)用于自動(dòng)駕駛、自主泊車、智能駕艙等場(chǎng)景,云測(cè)數(shù)據(jù)為其提供多維度、多模態(tài)的數(shù)據(jù)服務(wù)。如在車內(nèi)場(chǎng)景中涉及到疲勞監(jiān)測(cè)、動(dòng)作識(shí)別、場(chǎng)景光線等一切會(huì)在車內(nèi)發(fā)生的場(chǎng)景,以及在車外環(huán)境中更復(fù)雜的障礙物、道路、天氣、地點(diǎn)、車道線、路標(biāo),以及一些長(zhǎng)尾場(chǎng)景諸如闖紅燈車輛、橫穿馬路的行人、路邊違章??康能囕v等所有可能會(huì)涉及的場(chǎng)景數(shù)據(jù),可實(shí)現(xiàn)連續(xù)幀標(biāo)注、2D圖像框選、圖像分割、3D點(diǎn)云標(biāo)注、2D3D融合標(biāo)注等眾多功能,。
再比如智能家居行業(yè)。智能家居多應(yīng)用于智能家電、智能音箱、智能掃地機(jī)器人等場(chǎng)景,云測(cè)數(shù)據(jù)依托于豐富項(xiàng)目經(jīng)驗(yàn)與優(yōu)秀的行業(yè)理解,為智能家居企業(yè)提供全類型的數(shù)據(jù)標(biāo)注數(shù)據(jù)采集服務(wù)。如語義分割、ASR語音轉(zhuǎn)寫,喚醒詞/控制詞、方言語料采集等等。
這其中,又涉及到AI技術(shù)中重要分支的自然語言處理(NLP),具體的商業(yè)化應(yīng)用有:機(jī)器翻譯、輿情監(jiān)測(cè)、自動(dòng)摘要、問答機(jī)器人、客服機(jī)器人、智能問診等,云測(cè)數(shù)據(jù)為以上眾多領(lǐng)域提供高質(zhì)量的NLP數(shù)據(jù)支撐。在云測(cè)數(shù)據(jù),以智能客服單個(gè)場(chǎng)景的意圖標(biāo)注,就分為10-20個(gè)大類,上百個(gè)子類,根據(jù)業(yè)務(wù)需求可能還會(huì)有進(jìn)一步的標(biāo)注細(xì)分。同時(shí),云測(cè)數(shù)據(jù)除了對(duì)NLP數(shù)據(jù)進(jìn)行對(duì)話意圖、領(lǐng)域、槽位等進(jìn)行判斷和標(biāo)注,還可以進(jìn)行多角度的泛化。
量變到質(zhì)變,數(shù)據(jù)是新基建的“基建”
其實(shí),站在AI數(shù)據(jù)服務(wù)的發(fā)展歷史角度看,AI對(duì)數(shù)據(jù)的要求也是伴隨著不同發(fā)展階段逐步提高。在AI商業(yè)化初期,AI算法對(duì)數(shù)據(jù)的精度要求不高,日常的AI訓(xùn)練首先要求數(shù)據(jù)量大,數(shù)據(jù)標(biāo)注質(zhì)量要求相對(duì)不那么嚴(yán)格。但是隨著AI與各個(gè)產(chǎn)業(yè)結(jié)合得愈加緊密,企業(yè)開始從實(shí)際落地場(chǎng)景出發(fā),高精度、高質(zhì)量以及更多維度的數(shù)據(jù),對(duì)現(xiàn)階段AI產(chǎn)業(yè)化落地的至關(guān)重要。
經(jīng)歷了從量到質(zhì)的改變,數(shù)據(jù)已成為引領(lǐng)人工智能發(fā)展的重要戰(zhàn)略窗口,人工智能可以說是目前最火的新基建之一,而高質(zhì)量數(shù)據(jù)就是人工智能基建的唯一和支撐AI產(chǎn)業(yè)化落地的基石。