上海2022年11月17日 /美通社/ -- 當萬物互聯時代的數據洪流滾滾而過,當AI和元宇宙的精妙算法嗷嗷待哺,人們驚訝地發(fā)現"原始數據"和"AI可用數據"之間存在著驚人的逆差,高質量機器數據的供給深深影響著AI的"智商"發(fā)育。
近日,澳鵬Appen全球副總裁、大中華及北亞區(qū)總經理田小鵬博士對過去三年的發(fā)展歷程進行了回顧:"澳鵬的定位很清晰,就是一家AI的數據服務公司。在AI的世界,80%靠數據,20%靠模型本身,澳鵬參與AI數據全鏈的服務,澳鵬和許許多多AI應用合作伙伴一起影響和訓練AI不斷改善、向善。"
從零到"第一"
澳鵬進入中國市場的步伐與許多全球化企業(yè)頗為相似,但卻又非常不同。
2019年,中國的AI生態(tài)和市場如春風吹過,快馬加鞭步入高速增長期,而此時的澳鵬已是全球AI數據服務細分領域的行業(yè)第一。同年10月,頂著行業(yè)領導者的光環(huán),澳鵬來到中國,田小鵬回憶,當時的創(chuàng)始團隊不足10人,正是這批創(chuàng)業(yè)者白手起家,開始了澳鵬在中國市場的傳奇發(fā)展歷程。
自2020年,受疫情、地緣沖突等多種因素影響,全球經濟正面臨空前嚴峻的挑戰(zhàn)。根據2022年4月國際貨幣基金組織(IMF)發(fā)布的報告顯示,2022年和2023年全球經濟增速將由2021年的6.1%下降至3.6%,較1月發(fā)布的預估值分別下降0.8%和0.2%。具體到亞洲地區(qū),博鰲亞洲論壇2022年年會報告中稱,亞洲區(qū)域經濟增速還有可能低于IMF預測值5.2%,預計為4.8%。
但是短短3年之后,澳鵬中國完成了"從零到‘第一'"的驚人一躍。與成立之初相比,至2022年中報發(fā)布,澳鵬中國在專注于人工智能數據服務商中營收排名第一。澳鵬中國在2021財年營收年實現421%的爆炸性增長。
三年中,澳鵬中國一直在高速成長的賽道上,并成為AI數據服務行業(yè)的領頭羊。在其他同業(yè)上市企業(yè)的財報中,中國AI數據服務的前三甲企業(yè)必提澳鵬,且其他本土友商要與澳鵬中國進行全方位對標。如今,中國排名前十位的互聯網企業(yè)、以及前十位自動駕駛公司中的九家企業(yè)都是澳鵬中國的客戶。
相較于此前國際巨頭在國內頻頻遇上的水土不服,澳鵬中國卻以閃電速度在中國市場崛起。"我們的快速發(fā)展讓競爭對手都覺得不可思議。"田小鵬表示,站在今天回望三年前,"也許我們從第一天開始就注定了與別人不一樣,其他人可能會按一套固有的模式運作,因為我們新進入這個市場,所以沒有太多的條條框框,澳鵬中國帶著這種天生的友好創(chuàng)新基因,開始重塑行業(yè)。"
田小鵬博士表示:"澳鵬中國通過這3年來的經驗,總結出"4+2"發(fā)展戰(zhàn)略,希望這些經驗能為AI數據服務這個新興行業(yè)帶來更多有益的思考:
除了上述四項核心能力之外,澳鵬中國在行業(yè)和地域寬度和縱深方面也早已面向AI世界張開了自己的雙臂。
澳鵬母公司持續(xù)看好中國市場,迄今為止已在中國市場投資數千萬美元,未來將持續(xù)加大對澳鵬中國發(fā)展的投資。在澳鵬全球已有的9大服務中心的基礎上,澳鵬中國還將進一步持續(xù)部署海外交付中心,助力中國企業(yè)出海至歐洲以及東南亞等地區(qū),為更多中國本土客戶的出海業(yè)務擴張?zhí)峁┵N身的交付服務。
做AI最好的"數據老師"
"伐來噻""接翎子""扎臺型"……讓AI聽懂上海話,對一些頭部國內智能語音服務巨頭來說已經不是難事,而在這背后,如果想教會AI一門新語言或方言,澳鵬也許就是那位最好的"老師"。
在某個語音類國家級項目中,澳鵬中國就為客戶提供了類似上海話語音包這樣的服務。為了讓AI擁有最好的上海話"素養(yǎng)",澳鵬邀請上海師范學大學專門研究華東地區(qū)方言的專家合作,對照上海話正字轉寫方言字典,訓練AI學到最正宗的上海話。
其實,上述案例僅僅是澳鵬中國海量案例中的一個縮影。無論上海話,還是拉脫維亞語,又或是多維圖像標注、自動駕駛數據服務,澳鵬中國都致力于提供最高質量的數據標準。"有時候客戶只要求數據準確率達到95%,但澳鵬最終做到了99.5%。"田小鵬強調,"質量、質量,在澳鵬的字典里,數據質量一定是被強調最多次的"。
澳鵬在行業(yè)、文化、語種等維度跨度廣泛,并擁有語言學專家。例如在小語種轉寫場景,交付資源日活躍量超過5000人;在自動駕駛領域,2D/3D 融合標注產能達到 2個月1000萬幀,覆蓋商用車、乘用車等各類車型。
在而平臺技術方面,有專家把澳鵬中國的AI數據標注平臺比作"AI數據標注的智能ERP",堪比改變了企業(yè)現代化、自動化流程管理的老牌IT公司經典ERP平臺。
對于什么樣的數據才是高質量的數據,田小鵬博士表示:"首先,訓練AI的'種子選手',一定得是最專業(yè)的。例如,上述案例中,高校的漢語言文學專家,就提供了最佳的培育AI的數據資源;又如,澳鵬在醫(yī)療類項目中,也會邀請專業(yè)的醫(yī)師來幫助進行數據標注,這些都保證了最終AI算法獲得的數據基礎是高質量的。"
其次,AI數據標注工具也得是最好的。企業(yè)需要一套成熟的技術體系,MatrixGo是澳鵬中國借鑒全球經驗自主研發(fā)的高精度AI數據標注平臺,好的數據治理工具能幫助企業(yè)事半功倍地高效達成目標。
再次,交付質量也是很關鍵的一環(huán)。澳鵬擁有非常強大的三輪質檢,在采集、標準、交付等各個環(huán)節(jié)上都進行數據把關,確保最終數據的高準確率。
最后,AI數據服務行業(yè)與傳統(tǒng)IT服務行業(yè)不同,AI在行業(yè)中的應用成熟常常需要一個漫長的過程,從"5%~10%的冷啟動"到99%的數據成熟度,可能涉及多輪數據采集、標注、治理和訓練,這需要AI數據服務提供商與客戶同頻,通過多次循環(huán)和演化,最終得到了滿意的數據訓練效果,這就需要在全流程上都保證高質量,并最終實現AI應用的商業(yè)化,甚至全球化落地。"
近年來,澳鵬發(fā)現,以自動駕駛為代表的圖像、影像數據服務需求增長迅速,自動駕駛汽車需要識別交通標志、行人、路況等。同理,線上課堂需要知道哪些孩子正在舉手、哪些注意力不集中;醫(yī)療行業(yè)則在電子病歷和醫(yī)療影像等領域發(fā)力……
根據澳鵬的觀察,AI應用正在滲透進入流通、教育、醫(yī)療等千行百業(yè),澳鵬的優(yōu)勢是可以接觸到所有這些行業(yè),并與AI行業(yè)客戶一起研判未來趨勢,看準行業(yè)變遷的動向。最近,澳鵬與國內多家頂級制造業(yè)企業(yè)都有接觸,AI在工業(yè)、電力等領域的應用也正呈現快速發(fā)展趨勢。
把數據關在"籠子"里
越來越多企業(yè)正意識到,數據是它們的核心競爭力之一,是"命根子"。但在AI應用的研發(fā)落地過程中,企業(yè)又必須與AI數據服務商合作,如何保證自己公司的數據在全流程中安全、可控,是幾乎每個AI應用開發(fā)商都非??粗氐年P鍵環(huán)節(jié),而這同樣也是澳鵬和所有AI數據服務商的一道必答題。
"無論在美國、歐洲,還是中國,澳鵬都嚴格遵守當地的數據相關法規(guī),并一如既往在整個項目數據周期中采取最嚴苛的數據權限管控、數據加密等數據安全管理和技術手段。"田小鵬博士表示,"數據不會跑出去,從平臺到接口,所有流程都在非常高標準的安全環(huán)境下完成"。
"所有客戶數據不會保存在澳鵬的數據服務器上,而是采用第三方的中立云服務提供商,如果客戶有需要,我們可以把平臺直接部署在客戶的私有云或服務器上,這樣一來,所有的數據都被留在了客戶的'倉內'。"
澳鵬中國保障在封閉的安全空間內為客戶提供高保密性的數據服務,主要是由位于大連和無錫的自建全職團隊完成,團隊規(guī)模 1000 人左右,而在非固定場地的項目,主要是借助澳鵬全球的超過100萬眾包資源實現交付。
在傳統(tǒng)IT服務中,也許10家客戶中只有一家需要簽署NDA保密協議,而在AI數據服務項目中,澳鵬與客戶之間100%都簽訂NDA協議。澳鵬在安全和隱私保護領域都通過了國際權威機構BSI頒發(fā)的認證。
田小鵬博士表示:"澳鵬有一個概念叫做'項目室',在澳鵬辦公室內,人們會看到一間又一間的項目室,通常都是大門緊閉的,只有通過人臉識別門禁才能進入,只有該項目成員才能進入。不僅如此,澳鵬員工在進入工作狀態(tài)前,是需要上交手機的,個別安全級別高的項目,工作人員還需要通過安檢。所以,不管物理側,還是網絡側,澳鵬都進行了徹底的安全隔離和管控。"
借AI傳遞向善的力量
光山縣,位于河南省東南部的一個小縣城,曾是定點扶貧縣。有一次,田小鵬意外地收到了來自光山縣的特殊禮物,都是當地的土特產,用來感謝近年來澳鵬公司為當地鄉(xiāng)親父老謀的"福利"。
"人心總是向善的"。由于澳鵬提供的AI數據標注項目,當地一部分人的收入得到了提升,這個小縣城的人們做夢想不到自己能以AI為生,讓AI數據服務成為自己的收入來源之一,"至少,這是一份嶄新的收入,可以緩解就業(yè)問題,而且非常安全可靠",田博士表示。
2022年10月14日,國家農業(yè)農村部公布《關于公布2022年國家鄉(xiāng)村振興示范縣創(chuàng)建名單的通知》,光山縣赫然上榜。
在科技飛速發(fā)展的時代,人類本身應該不斷改善、向善,人類也同時應該影響和訓練AI不斷改善、向善,"澳鵬中國雖然幫助了一些人,但我認為我們還在努力的路上,我們幫的人還不夠多,也許未來某一天,我們可以幫助10萬、甚至100萬人。"
田小鵬博士表示:"AI數據服務行業(yè)是一個人賦能機器和算法的行業(yè),所以首先我們最需要尊重的就是人。澳鵬不希望這個行業(yè)走偏,雖然價格永遠是商業(yè)競爭中躲不過去的關口,但我們絕不能通過降低員工和從業(yè)者收入來提升商業(yè)競爭力。在澳鵬,拼的是管理和技術,好的管理可以省錢,好的技術同樣可以提高效率。我們希望能把行業(yè)蛋糕做大,讓從業(yè)者都能獲得公平的報酬。"
"我曾經收到過一封來信,寫信的人是一位在讀博士,他在東北的黑龍江,他不希望自己在這個年紀還向家里要錢,他希望用自己的知識打一份工,而我們的某個AI數據標準項目恰恰很符合他的專業(yè),他可以憑借自己的知識和勞動獲得相應的報酬,對此他表示感恩和感謝。
我甚至可以感覺到這是一個很上進的孩子,他在AI和自己擅長的領域之間找到自身的價值,并獲得了回報。這是我們行業(yè)非常需要的 -- 向善的力量。"
作為全球和國內行業(yè)的領導者,澳鵬Appen始終倡導AI數據服務行業(yè)走向更加健康的競爭生態(tài),讓更多的人來到AI這個新興行業(yè),并收獲幫助。