omniture

澳鵬Appen:自動駕駛浪潮下,如何給技術迭代插上數(shù)據(jù)的“翅膀”?

上海2021年12月22日 /美通社/ -- 微信公眾號“高工智能汽車”最近對澳鵬Appen進行了報道,下面是報道原文:

在自動駕駛時代,無論是對于汽車制造商、零部件廠商還是自動駕駛服務提供商來說,數(shù)據(jù)都相當于金錢,身處其中的企業(yè)都非常清楚這個公式。

去年,滴滴出行與比亞迪合作,推出全球首款定制網(wǎng)約車。該公司CEO程維表示,滴滴計劃于2025年推出D3,普及100萬輛搭載自動駕駛功能網(wǎng)約車;2030年希望去掉駕駛艙,計劃實現(xiàn)完全自動駕駛。

今年初,百度和吉利宣布合資成立一家全新的聯(lián)網(wǎng)智能汽車公司,基于后者的開放動力底盤平臺,結合百度的人工智能、Apollo自動駕駛、小度車載、百度地圖等軟件,目標是讓所有人都能使用自動駕駛汽車。

按照這家合資公司(集度汽車)首席執(zhí)行官夏一平的話說,公司打算以合理的成本向千家萬戶提供4級自動駕駛技術,“就像別人希望普及電動汽車一樣,我們也希望普及自動駕駛技術。”

而這些企業(yè),不管以何種方式入局“造車”,目的只有一個,希望打造自己的大規(guī)模數(shù)據(jù)訓練、功能迭代閉環(huán)。

正如行業(yè)領頭羊特斯拉的玩法一樣,在量產(chǎn)中結合車端的智能處理能力識別出不智能的場景,將數(shù)據(jù)回傳,以此迭代算法,不斷提高自動駕駛的能力,逐步構建自己的車輛規(guī)模和技術壁壘。

另一方面,對于確保自動駕駛行車安全運行方面,高質量的訓練數(shù)據(jù)極其關鍵。這就要求行業(yè)加強審核,避免“garbage in, garbage out”的情況發(fā)生。

這就要求,負責訓練模型的團隊不僅要面對自身專業(yè)度的挑戰(zhàn),而且要面對確保數(shù)據(jù)標注過程質量的巨大挑戰(zhàn)。

在這方面,澳鵬可以說是當之無愧的模范生。

破解市場困局

相關研究發(fā)現(xiàn),在AI行業(yè)中,有兩個層面符合二八法則。

首先,同一個算法的應用中,同樣類型技術方案的公司差異會很大。其中的關鍵就在于數(shù)據(jù)量。同一個算法對于最后結果的影響,80%來源于數(shù)據(jù),20%來源于技術。

簡單來說,算法模型本身的優(yōu)化對于提升AI應用輸出的準確率十分有限,而不同AI應用準確率的關鍵差別在于其中是否有大量的、高質量的訓練數(shù)據(jù)。

其次,很多AI或算法公司在做研發(fā)時,80%的時間或人力需要用于處理數(shù)據(jù),只有20%用于處理算法與代碼。而實際上,這種做法并不合理。要想精進整體系統(tǒng)的魯棒性,工程師應該將更多的精力集中于算法或應用層面,而針對數(shù)據(jù)層面,則可以讓更專業(yè)的供應商幫助他們提升質量和效率。

另一方面,目前人工智能研究應用的算法,基本基于機器學習和神經(jīng)網(wǎng)絡算法,實戰(zhàn)中對訓練數(shù)據(jù)的準確率要求起碼要到達90%以上,甚至有的項目要求能夠做到99.9%準確率。而更難的地方在于,這不僅是對某一批數(shù)據(jù)的要求,而是要持續(xù)達到這個要求。

有行業(yè)人員表示,自動駕駛領域的AI部署需要大量的高質量訓練數(shù)據(jù),需求增長極快,且需求和場景越來越多樣、難度越來越大。隨業(yè)內(nèi)需求從2D平面圖像轉向3D LiDAR數(shù)據(jù)為主,行業(yè)對于標注人員專業(yè)度的要求也隨之水漲船高。

而標注人員在完成這些數(shù)據(jù)任務時,可能面臨諸多挑戰(zhàn),其中包括:內(nèi)部標注人員不足和引入的偏差問題、時間限制下難以達到所需的數(shù)量規(guī)模及準確率。

此外,當前數(shù)據(jù)行業(yè)各個服務商的水平參差不齊,優(yōu)質頭部數(shù)據(jù)服務商的服務資源稀缺,CR5的集中只有20~30%。業(yè)內(nèi)也普遍缺乏進行復雜標注項目所需的專業(yè)工具。這無疑為數(shù)據(jù)質量帶來了更多挑戰(zhàn)。

“這也是澳鵬本身創(chuàng)立的初衷?!卑涅iAppen中國區(qū)市場拓展高級總監(jiān) 董成表示。

作為澳大利亞的一家上市公司,澳鵬自1996年創(chuàng)建至今,始終專注于人工智能訓練數(shù)據(jù)的領域,目前在語音、文字、圖像和視頻等標注領域已積累了25+年的經(jīng)驗。服務范圍覆蓋170多個國家,235+種語言。全球正式員工 1100+,擁有100萬+全球眾包資源。截至2020年,公司營收已達4.1億的美金。

其中國分公司成立于2019年,總部位于上海,在無錫、大連、北京設有交付中心和分公司,業(yè)務廣泛覆蓋全中國及亞太地區(qū),擁有1000+名交付人員。目前,澳鵬合作客戶已遍及國內(nèi)領先大型互聯(lián)網(wǎng)公司與高科技企業(yè)。

作為數(shù)據(jù)行業(yè)的優(yōu)質典范,澳鵬擁有強大的交付產(chǎn)能及資源管理優(yōu)勢,服務的客戶和項目數(shù)以百計。澳鵬無錫、大連交付中心經(jīng)驗豐富的交付團隊,處理過2D、3DLiDAR等各種數(shù)據(jù)和不同客戶的業(yè)務需求,汽車2D和3D點云的周交付能力超過百萬幀;卓越運營中心的管理模式可保證持續(xù)的高質量交付。

在自動駕駛領域,澳鵬高精度高性能的自動駕駛工具套裝也是其為客戶構筑海量數(shù)據(jù)資產(chǎn)的利器,這也是澳鵬的核心優(yōu)勢之一。

全面保障數(shù)據(jù)質量

為了適應高速變化的市場形式,澳鵬構建了完整的數(shù)據(jù)質量全生命周期管理體系,可以從數(shù)據(jù)的采集、標注、模型訓練、數(shù)據(jù)可視化、模型的部署及再訓練等全過程,實現(xiàn)實時自動的模型再訓練和改裝。

其自主研發(fā)的人工智能輔助數(shù)據(jù)標注平臺可支持像素級語義分割、2D圖像復合標注、3D點云拉框及語義分割等功能。采標一體的任務能夠實現(xiàn)采集-質檢-標注-質檢-客戶驗收的雙向協(xié)同流程,讓整個數(shù)據(jù)生產(chǎn)線上的各個環(huán)節(jié)實現(xiàn)無縫銜接。內(nèi)置的多輪質檢模塊可以按需配置,滿足不同復雜度項目的需求。

2D圖像復合標注是全結構化的模型訓練利器,支持點、線、框、多邊型融合標注(常見工具是單模式的,點、線or折線,多邊形)與連續(xù)幀;另外,此工具還支持像素級語義分割,可將圖片中目標對象實例標記出來,并保證像素級的質量。其中豐富的可配置選項可靈活進行id處理,實戰(zhàn)中可以做到10分鐘/張圖。

澳鵬Appen中國區(qū)市場拓展高級總監(jiān) 董成介紹,澳鵬利用ML輔助標注等技術手段提高數(shù)據(jù)質量,通過預識別系統(tǒng),讓算法先進行預識別,再根據(jù)結果進行人為調(diào)整,最終在成本控制和質量上實現(xiàn)顯著提升。

比如在3D點云數(shù)據(jù)中,由于車道線本身的多樣性(環(huán)島、交叉線)以及外界光照、車輛遮擋等影響,3D點云數(shù)據(jù)中的車道線標注一直是一個困難且耗時的課題。澳鵬3D點云車道線自動識別的研發(fā)是解決這一難題的重大突破。

澳鵬Appen 3D點云車道線自動識別 模型效果展示
澳鵬Appen 3D點云車道線自動識別 模型效果展示

“我們3D點云拉框可支持自動貼合、連續(xù)幀映射,及3D/2D的融合標注,具備目標預識別功能,能靈活配置數(shù)據(jù)有效性驗證規(guī)則,可直接在線上讓客戶做最低交付粒度的驗收且可無縫打回。實戰(zhàn)中能夠做到99.9%準確率, 1秒/幀的極速質檢?!卑涅iAppen中國區(qū)市場拓展高級總監(jiān) 董成表示。

此外,澳鵬的每個項目中除了配備專職的項目經(jīng)理,還有專門的QA/質檢人員,Team Leader、等層層把關質量控制;大多數(shù)項目都采用多輪質檢的方案,保障數(shù)據(jù)質量無限接近完美。

值得一提的是,澳鵬內(nèi)部對于安全合規(guī)的要求非常高,除了有健全的數(shù)據(jù)安全管理流程外,澳鵬還為了保障數(shù)據(jù)安全專門設置了DPO(Data Privacy Officer,數(shù)據(jù)合規(guī)官)。

所有的項目在簽單、立項前都需要通過數(shù)據(jù)合規(guī)官的審核、批準,并根據(jù)數(shù)據(jù)合規(guī)的要求在項目執(zhí)行中采取相應的數(shù)據(jù)保障措施。

“我們對人工智能模型所使用的數(shù)據(jù)給予最大限度的關注和保護,致力于為客戶提供最高級別的數(shù)據(jù)安全標準,符合全球多項嚴格的數(shù)據(jù)安全資質認證。同時,我們的平臺每天都會進行漏洞掃描,最大限度的保證客戶數(shù)據(jù)資產(chǎn)安全?!卑涅iAppen中國區(qū)市場拓展高級總監(jiān) 董成表示。

平臺中設有權限管控、數(shù)據(jù)加密傳輸、PII信息加密存儲等嚴格的數(shù)據(jù)安全管控策略,交付管理具體包括:平臺進行周期性系統(tǒng)漏洞掃描以免受惡意代碼/病毒攻擊; 24x7的全球IT支持團隊和緊急響應小組確保對IT事件及時響應等等。

目前,澳鵬已在全球獲得ISO 27001安全認證,包括位于上海的商務和研發(fā)總部、以及無錫和大連的數(shù)據(jù)服務交付中心。全球范圍內(nèi),澳鵬亦通過了GDPR,SOC 2 Type II,HIPAA等全球不同國家和地區(qū)的數(shù)據(jù)安全合規(guī)認證。

某位與澳鵬合作的客戶負責人表示:“澳鵬與我們團隊的合作非常順利,其平臺有助于我們確保流程根據(jù)項目需求不斷被優(yōu)化。我們也期待這一試點項目能盡快投入生產(chǎn)?!?/p>

原文鏈接:https://mp.weixin.qq.com/s/xquKbVJUPUZfHEIZqj3VTA

消息來源:澳鵬數(shù)據(jù)科技(上海)有限公司
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection