近日,捷通華聲宣布靈云智能開放平臺(hcicloud.ocm)多語種OCR識別能力服務(wù)進(jìn)入試運(yùn)營階段,開始提供包括中文、英文、德文、法文、俄文、西班牙文、意大利文等十幾個(gè)國家語言文字的自動(dòng)識別服務(wù)。此次靈云多語種OCR能力的發(fā)布,也是繼靈云平臺推出13種語言的靈云語音合成、93種語言的靈云手寫識別技術(shù)能力之后,靈云平臺服務(wù)多國語言方面所取得的最新進(jìn)展。
作為中國人工智能領(lǐng)域的領(lǐng)軍企業(yè),捷通華聲自2000年開始堅(jiān)持自主研究智能語音、圖像等人工智能技術(shù),并不斷在OCR、手寫識別等智能圖像技術(shù)領(lǐng)域取得突破。近年來,靈云OCR在掃描識別領(lǐng)域異軍突起,以接近100%的中英文識別率和優(yōu)質(zhì)的版面分析能力獲得了產(chǎn)業(yè)內(nèi)廣大用戶的認(rèn)可,為企業(yè)大幅減少了人工文字錄入工作量、提高了文檔編輯和搜索的效率。伴隨經(jīng)濟(jì)全球化的進(jìn)展,人工智能技術(shù)在多語言環(huán)境中的應(yīng)用需求越來越迫切。捷通華聲順應(yīng)產(chǎn)業(yè)發(fā)展趨勢,在加大多語言人工智能技術(shù)研究的基礎(chǔ)上,依托靈云智能開放平臺以開放、合作、共贏的戰(zhàn)略發(fā)展思路,與國內(nèi)外頂尖人工智能研究機(jī)構(gòu)、企業(yè)開展廣泛合作,全面為中國企業(yè)提供多語言人工智能技術(shù)能力服務(wù)。此次上線的多語種OCR,可以幫助企業(yè)與廣大用戶將德文、法文、俄文、西班牙文、意大利文等不同國家語言的文件、書籍、報(bào)紙、雜志等檔案數(shù)字化,生成便于傳輸和管理的PDF文件,將有力促進(jìn)國內(nèi)企業(yè)參與國際交流。
自靈云智能開放平臺(hcicloud.ocm)2011年推出靈云OCR以來,不僅面向廣大用戶提供直接文字識別服務(wù),同時(shí)針對金融,能源,交通,政府,企業(yè)等領(lǐng)域企業(yè)戶提供定制化服務(wù)。靈云OCR通過匹配圖像中的關(guān)鍵信息來自動(dòng)確認(rèn)圖像種類,獲得更加準(zhǔn)確的識別結(jié)果。目前靈云OCR已實(shí)現(xiàn)對身份證,駕駛證、行駛證、增值稅發(fā)票,銀行卡號、名片等各類證照、票據(jù)、表單的識別。針對特殊需求,靈云OCR還可以提供特殊定制功能,針對用戶的圖像種類進(jìn)行模板定制,實(shí)現(xiàn)“一種核心,多類圖像”的應(yīng)用效果,尤其是在各大銀行,證劵、保險(xiǎn)公司,能源、電信、醫(yī)療、政府等辦公營業(yè)廳的應(yīng)用中,已成功實(shí)現(xiàn)人證統(tǒng)一、票據(jù)電子化、無紙化辦公等功能,極大節(jié)省了大眾用戶辦理業(yè)務(wù)的等待時(shí)間,也極大節(jié)省了企業(yè)業(yè)務(wù)成本,提高了辦公效率,并通過減少大量復(fù)印以符合綠色環(huán)保辦公的新趨勢。
靈云OCR支持掃描儀、手機(jī)、照相機(jī)、攝像機(jī)、高拍儀等各種圖像掃描、拍照設(shè)備,并兼容市場的主流業(yè)務(wù)系統(tǒng)。在各種系統(tǒng)應(yīng)用中,靈云OCR在確保原業(yè)務(wù)系統(tǒng)穩(wěn)定性和安全性的同時(shí),也可借助自學(xué)習(xí)功能不斷豐富字符/圖像特征庫,從而提高自身在識別時(shí)對圖像的適應(yīng)能力。除了企事業(yè)辦公以外,人們生活的方方面面也因靈云OCR技術(shù)的廣泛應(yīng)用而更加的生動(dòng)有趣。目前,用戶已經(jīng)可以用手機(jī)、數(shù)碼相機(jī)或DV拍照名片等紙質(zhì)資料,并利用靈云OCR軟件識別轉(zhuǎn)換成可編輯的電子資料??梢韵胂螅蘸箪`云OCR的應(yīng)用場景將會越來越廣泛,使用也將會越來越便捷。
靈云平臺此次推出多語種OCR也標(biāo)示著靈云平臺在實(shí)施面向國際、全面提供人工智能服務(wù)戰(zhàn)略規(guī)劃中,完成了第三步重要舉措。作為國內(nèi)唯一全方位人工智能云服務(wù)開放平臺,靈云平臺囊括了語音合成(TTS)、語音識別(ASR)、手寫識別(HWR)、光學(xué)字符識別(OCR)、自然語言理解(NLU)以及機(jī)器翻譯(MT)等多項(xiàng)人工智能能力,全方位賦予計(jì)算機(jī)思維和感官能力,使人與機(jī)器的溝通更加簡單自然。2012年,靈云平臺在手寫識別領(lǐng)域邁出了國際化道路上第一步:推出覆蓋全球92種語言的靈云手寫識別技術(shù),此舉標(biāo)志著我國手寫識別技術(shù)已經(jīng)達(dá)到國際領(lǐng)先水平!2013年,靈云平臺繼提供中文普通話、粵語、維吾爾語、英語服務(wù)之后,開始提供德語、法語、日語、韓語等13種語言的靈云語音合成技術(shù),為需要多國語言服務(wù)的中國企業(yè)提供了最豐富、最有力的智能語音能力支撐,邁出了靈云智能開放平臺助力中國企業(yè)開拓國際市場、支持參與國際競爭的跨越之步。
捷通華聲在全面推動(dòng)中國人工智能產(chǎn)業(yè)發(fā)展的進(jìn)程中,靈云平臺得到了清華大學(xué)的鼎力支持。捷通華聲與清華大學(xué)人工智能重點(diǎn)實(shí)驗(yàn)室在圖像識別、語音交互、語義理解等人工智能技術(shù)領(lǐng)域全面展開合作,在不斷完善OCR多樣化應(yīng)用的同時(shí),也在為研發(fā)更豐富的圖像識別技術(shù)而努力,并將很快推出人臉識別等更多元化的圖像識別技術(shù),保證靈云平臺擁有更加全面的“視覺與感觀”能力。
靈云智能開放平臺(hcicloud.ocm)自2011年推出以來,已經(jīng)為金融、電信、醫(yī)療、交通、能源、教育、醫(yī)療、政府等各個(gè)領(lǐng)域的用戶提供人工智能技術(shù)服務(wù),并以“云+端”的服務(wù)方式為百度導(dǎo)航、搜狗地圖、京東商城、網(wǎng)易有道、滴滴打車、天行聽書、天行輸入法等數(shù)千款移動(dòng)應(yīng)用提供支持,為超過3億社會大眾提供服務(wù)。此次靈云多語種OCR的推出將進(jìn)一步加強(qiáng)靈云與企業(yè)間的合作,為中國企業(yè)向國際化拓展提供更為有力的支持。未來發(fā)展,捷通華聲靈云平臺將在發(fā)揮靈云OCR等智能技術(shù)優(yōu)勢的基礎(chǔ)上加強(qiáng)與清華大學(xué)深度合作,不斷推出識別率更高、更寬廣的智能圖像識別技術(shù)與解決方案,為廣大企業(yè)與用戶提供人工智能技術(shù)服務(wù),共同實(shí)現(xiàn)“靈云科技 源自清華 服務(wù)全球”的戰(zhàn)略發(fā)展規(guī)劃!