omniture

澳鵬Appen中國第三年:緣何成為AI訓練數據服務行業(yè)領頭羊?

上海2022年11月17日 /美通社/ -- 當萬物互聯時代的數據洪流滾滾而過,當AI和元宇宙的精妙算法嗷嗷待哺,人們驚訝地發(fā)現"原始數據"和"AI可用數據"之間存在著驚人的逆差,高質量機器數據的供給深深影響著AI的"智商"發(fā)育。

近日,澳鵬Appen全球副總裁、大中華及北亞區(qū)總經理田小鵬博士對過去三年的發(fā)展歷程進行了回顧:"澳鵬的定位很清晰,就是一家AI的數據服務公司。在AI的世界,80%靠數據,20%靠模型本身,澳鵬參與AI數據全鏈的服務,澳鵬和許許多多AI應用合作伙伴一起影響和訓練AI不斷改善、向善。"

澳鵬Appen全球副總裁、大中華及北亞區(qū)總經理田小鵬博士
澳鵬Appen全球副總裁、大中華及北亞區(qū)總經理田小鵬博士

從零到"第一"

澳鵬進入中國市場的步伐與許多全球化企業(yè)頗為相似,但卻又非常不同。

2019年,中國的AI生態(tài)和市場如春風吹過,快馬加鞭步入高速增長期,而此時的澳鵬已是全球AI數據服務細分領域的行業(yè)第一。同年10月,頂著行業(yè)領導者的光環(huán),澳鵬來到中國,田小鵬回憶,當時的創(chuàng)始團隊不足10人,正是這批創(chuàng)業(yè)者白手起家,開始了澳鵬在中國市場的傳奇發(fā)展歷程。

自2020年,受疫情、地緣沖突等多種因素影響,全球經濟正面臨空前嚴峻的挑戰(zhàn)。根據2022年4月國際貨幣基金組織(IMF)發(fā)布的報告顯示,2022年和2023年全球經濟增速將由2021年的6.1%下降至3.6%,較1月發(fā)布的預估值分別下降0.8%和0.2%。具體到亞洲地區(qū),博鰲亞洲論壇2022年年會報告中稱,亞洲區(qū)域經濟增速還有可能低于IMF預測值5.2%,預計為4.8%。

但是短短3年之后,澳鵬中國完成了"從零到‘第一'"的驚人一躍。與成立之初相比,至2022年中報發(fā)布,澳鵬中國在專注于人工智能數據服務商中營收排名第一。澳鵬中國在2021財年營收年實現421%的爆炸性增長。

三年中,澳鵬中國一直在高速成長的賽道上,并成為AI數據服務行業(yè)的領頭羊。在其他同業(yè)上市企業(yè)的財報中,中國AI數據服務的前三甲企業(yè)必提澳鵬,且其他本土友商要與澳鵬中國進行全方位對標。如今,中國排名前十位的互聯網企業(yè)、以及前十位自動駕駛公司中的九家企業(yè)都是澳鵬中國的客戶。

相較于此前國際巨頭在國內頻頻遇上的水土不服,澳鵬中國卻以閃電速度在中國市場崛起。"我們的快速發(fā)展讓競爭對手都覺得不可思議。"田小鵬表示,站在今天回望三年前,"也許我們從第一天開始就注定了與別人不一樣,其他人可能會按一套固有的模式運作,因為我們新進入這個市場,所以沒有太多的條條框框,澳鵬中國帶著這種天生的友好創(chuàng)新基因,開始重塑行業(yè)。"

田小鵬博士表示:"澳鵬中國通過這3年來的經驗,總結出"4+2"發(fā)展戰(zhàn)略,希望這些經驗能為AI數據服務這個新興行業(yè)帶來更多有益的思考:

  1. 全球視野。澳鵬公司是一家成立于1996年的公司,在技術和專業(yè)數據服務上都有深厚的全球行業(yè)經驗和積累,而中國澳鵬團隊的許多成員來自于全世界第一流的IT服務公司,由這樣的全球化團隊和技術來服務中國的AI企業(yè),無疑可以幫助中國企業(yè)快速獲得全球AI最佳實踐,并為它們的業(yè)務出海極致賦能。
  2. 研發(fā)技術領先、獨立。澳鵬中國是知識產權獨立自主的中國公司。澳鵬中國非常重視技術研發(fā),在僅有5、6個人的時候就已組建了自研團隊,目前中國團隊開發(fā)的企業(yè)級AI數據標注平臺叫做MatrixGo,該平臺在中國注冊,擁有獨立知識產權,與海外完全隔離。目前,每年約有2000個項目運行在MatrixGo上,平臺技術在2D、3D圖像標注領域是中國最領先的,極大增強了中國企業(yè)AI項目的規(guī)?;瘮U展能力。
  3. 精益管理。澳鵬中國構建了一支來自于IBM等全球著名咨詢公司的服務交付管理團隊,擁有豐富的知識管理、SLA(服務水平)管理、質量管理、安全管理等經驗,同時兼有對不同行業(yè)的深耕經驗,使得澳鵬長期為全球高科技、汽車、消費電子、電子商務、金融服務、醫(yī)療健康及科研機構等行業(yè)提供高質量、高效的、安全的數據服務。
  4. 交付能力及資源。目前,澳鵬中國總部位于中國AI之都上海,在無錫、大連、重慶均設有大型交付中心。目前,澳鵬擁有超過1600名全職員工、1000+BPO(商務流程外包)資源、數萬名高質量的本土眾包人員并持續(xù)擴張中。強大的交付團隊能應對來自中國AI和互聯網公司靈活多變的數據服務需求。"

除了上述四項核心能力之外,澳鵬中國在行業(yè)和地域寬度和縱深方面也早已面向AI世界張開了自己的雙臂。

  1. 行業(yè)深耕。除了在澳鵬優(yōu)勢較為明顯的自動駕駛、圖像類等重點領域不斷保持技術領先和突破,澳鵬技術人員還積極拓展新型細分AI行業(yè),在如音樂、醫(yī)療、電子等領域提前布局,并把握元宇宙等未來方向。
  2. 海外布局。越來越多的中國企業(yè)在海外市場大放異彩,在許多中國和全球消費者耳熟能詳的手機、新能源汽車品牌"出海"的背后,都有澳鵬深厚全球技術積累的背影。

澳鵬中國“4+2”發(fā)展戰(zhàn)略
澳鵬中國“4+2”發(fā)展戰(zhàn)略

澳鵬母公司持續(xù)看好中國市場,迄今為止已在中國市場投資數千萬美元,未來將持續(xù)加大對澳鵬中國發(fā)展的投資。在澳鵬全球已有的9大服務中心的基礎上,澳鵬中國還將進一步持續(xù)部署海外交付中心,助力中國企業(yè)出海至歐洲以及東南亞等地區(qū),為更多中國本土客戶的出海業(yè)務擴張?zhí)峁┵N身的交付服務。

AI最好的"數據老師"

"伐來噻""接翎子""扎臺型"……讓AI聽懂上海話,對一些頭部國內智能語音服務巨頭來說已經不是難事,而在這背后,如果想教會AI一門新語言或方言,澳鵬也許就是那位最好的"老師"。

在某個語音類國家級項目中,澳鵬中國就為客戶提供了類似上海話語音包這樣的服務。為了讓AI擁有最好的上海話"素養(yǎng)",澳鵬邀請上海師范學大學專門研究華東地區(qū)方言的專家合作,對照上海話正字轉寫方言字典,訓練AI學到最正宗的上海話。

其實,上述案例僅僅是澳鵬中國海量案例中的一個縮影。無論上海話,還是拉脫維亞語,又或是多維圖像標注、自動駕駛數據服務,澳鵬中國都致力于提供最高質量的數據標準。"有時候客戶只要求數據準確率達到95%,但澳鵬最終做到了99.5%。"田小鵬強調,"質量、質量,在澳鵬的字典里,數據質量一定是被強調最多次的"。

澳鵬在行業(yè)、文化、語種等維度跨度廣泛,并擁有語言學專家。例如在小語種轉寫場景,交付資源日活躍量超過5000人;在自動駕駛領域,2D/3D 融合標注產能達到 2個月1000萬幀,覆蓋商用車、乘用車等各類車型。 

在而平臺技術方面,有專家把澳鵬中國的AI數據標注平臺比作"AI數據標注的智能ERP",堪比改變了企業(yè)現代化、自動化流程管理的老牌IT公司經典ERP平臺。

對于什么樣的數據才是高質量的數據,田小鵬博士表示:"首先,訓練AI的'種子選手',一定得是最專業(yè)的。例如,上述案例中,高校的漢語言文學專家,就提供了最佳的培育AI的數據資源;又如,澳鵬在醫(yī)療類項目中,也會邀請專業(yè)的醫(yī)師來幫助進行數據標注,這些都保證了最終AI算法獲得的數據基礎是高質量的。"

其次,AI數據標注工具也得是最好的。企業(yè)需要一套成熟的技術體系,MatrixGo是澳鵬中國借鑒全球經驗自主研發(fā)的高精度AI數據標注平臺,好的數據治理工具能幫助企業(yè)事半功倍地高效達成目標。

再次,交付質量也是很關鍵的一環(huán)。澳鵬擁有非常強大的三輪質檢,在采集、標準、交付等各個環(huán)節(jié)上都進行數據把關,確保最終數據的高準確率。

最后,AI數據服務行業(yè)與傳統(tǒng)IT服務行業(yè)不同,AI在行業(yè)中的應用成熟常常需要一個漫長的過程,從"5%~10%的冷啟動"到99%的數據成熟度,可能涉及多輪數據采集、標注、治理和訓練,這需要AI數據服務提供商與客戶同頻,通過多次循環(huán)和演化,最終得到了滿意的數據訓練效果,這就需要在全流程上都保證高質量,并最終實現AI應用的商業(yè)化,甚至全球化落地。"

近年來,澳鵬發(fā)現,以自動駕駛為代表的圖像、影像數據服務需求增長迅速,自動駕駛汽車需要識別交通標志、行人、路況等。同理,線上課堂需要知道哪些孩子正在舉手、哪些注意力不集中;醫(yī)療行業(yè)則在電子病歷和醫(yī)療影像等領域發(fā)力……

根據澳鵬的觀察,AI應用正在滲透進入流通、教育、醫(yī)療等千行百業(yè),澳鵬的優(yōu)勢是可以接觸到所有這些行業(yè),并與AI行業(yè)客戶一起研判未來趨勢,看準行業(yè)變遷的動向。最近,澳鵬與國內多家頂級制造業(yè)企業(yè)都有接觸,AI在工業(yè)、電力等領域的應用也正呈現快速發(fā)展趨勢。

把數據關在"籠子"里

越來越多企業(yè)正意識到,數據是它們的核心競爭力之一,是"命根子"。但在AI應用的研發(fā)落地過程中,企業(yè)又必須與AI數據服務商合作,如何保證自己公司的數據在全流程中安全、可控,是幾乎每個AI應用開發(fā)商都非??粗氐年P鍵環(huán)節(jié),而這同樣也是澳鵬和所有AI數據服務商的一道必答題。

 "無論在美國、歐洲,還是中國,澳鵬都嚴格遵守當地的數據相關法規(guī),并一如既往在整個項目數據周期中采取最嚴苛的數據權限管控、數據加密等數據安全管理和技術手段。"田小鵬博士表示,"數據不會跑出去,從平臺到接口,所有流程都在非常高標準的安全環(huán)境下完成"。

"所有客戶數據不會保存在澳鵬的數據服務器上,而是采用第三方的中立云服務提供商,如果客戶有需要,我們可以把平臺直接部署在客戶的私有云或服務器上,這樣一來,所有的數據都被留在了客戶的'倉內'。"

澳鵬中國保障在封閉的安全空間內為客戶提供高保密性的數據服務,主要是由位于大連和無錫的自建全職團隊完成,團隊規(guī)模 1000 人左右,而在非固定場地的項目,主要是借助澳鵬全球的超過100萬眾包資源實現交付。

在傳統(tǒng)IT服務中,也許10家客戶中只有一家需要簽署NDA保密協議,而在AI數據服務項目中,澳鵬與客戶之間100%都簽訂NDA協議。澳鵬在安全和隱私保護領域都通過了國際權威機構BSI頒發(fā)的認證。

田小鵬博士表示:"澳鵬有一個概念叫做'項目室',在澳鵬辦公室內,人們會看到一間又一間的項目室,通常都是大門緊閉的,只有通過人臉識別門禁才能進入,只有該項目成員才能進入。不僅如此,澳鵬員工在進入工作狀態(tài)前,是需要上交手機的,個別安全級別高的項目,工作人員還需要通過安檢。所以,不管物理側,還是網絡側,澳鵬都進行了徹底的安全隔離和管控。"

AI傳遞向善的力量

光山縣,位于河南省東南部的一個小縣城,曾是定點扶貧縣。有一次,田小鵬意外地收到了來自光山縣的特殊禮物,都是當地的土特產,用來感謝近年來澳鵬公司為當地鄉(xiāng)親父老謀的"福利"。

 "人心總是向善的"。由于澳鵬提供的AI數據標注項目,當地一部分人的收入得到了提升,這個小縣城的人們做夢想不到自己能以AI為生,讓AI數據服務成為自己的收入來源之一,"至少,這是一份嶄新的收入,可以緩解就業(yè)問題,而且非常安全可靠",田博士表示。

2022年10月14日,國家農業(yè)農村部公布《關于公布2022年國家鄉(xiāng)村振興示范縣創(chuàng)建名單的通知》,光山縣赫然上榜。

在科技飛速發(fā)展的時代,人類本身應該不斷改善、向善,人類也同時應該影響和訓練AI不斷改善、向善,"澳鵬中國雖然幫助了一些人,但我認為我們還在努力的路上,我們幫的人還不夠多,也許未來某一天,我們可以幫助10萬、甚至100萬人。"

田小鵬博士表示:"AI數據服務行業(yè)是一個人賦能機器和算法的行業(yè),所以首先我們最需要尊重的就是人。澳鵬不希望這個行業(yè)走偏,雖然價格永遠是商業(yè)競爭中躲不過去的關口,但我們絕不能通過降低員工和從業(yè)者收入來提升商業(yè)競爭力。在澳鵬,拼的是管理和技術,好的管理可以省錢,好的技術同樣可以提高效率。我們希望能把行業(yè)蛋糕做大,讓從業(yè)者都能獲得公平的報酬。"

"我曾經收到過一封來信,寫信的人是一位在讀博士,他在東北的黑龍江,他不希望自己在這個年紀還向家里要錢,他希望用自己的知識打一份工,而我們的某個AI數據標準項目恰恰很符合他的專業(yè),他可以憑借自己的知識和勞動獲得相應的報酬,對此他表示感恩和感謝。

我甚至可以感覺到這是一個很上進的孩子,他在AI和自己擅長的領域之間找到自身的價值,并獲得了回報。這是我們行業(yè)非常需要的 -- 向善的力量。"

作為全球和國內行業(yè)的領導者,澳鵬Appen始終倡導AI數據服務行業(yè)走向更加健康的競爭生態(tài),讓更多的人來到AI這個新興行業(yè),并收獲幫助。

消息來源:澳鵬數據科技(上海)有限公司
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯網、科技、媒體、通訊企業(yè)的經營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection