上海2021年12月8日 /美通社/ -- 近日,繼2019-2020年獲得視覺(jué)跟蹤領(lǐng)域國(guó)際頂級(jí)賽事 VOT(Visual-Object-Tracking Challenge )多項(xiàng)挑戰(zhàn)賽冠軍以來(lái),中科智云-大連理工聯(lián)合AI實(shí)驗(yàn)室在今年計(jì)算機(jī)視覺(jué)三大頂會(huì)之一 -- 國(guó)際計(jì)算機(jī)視覺(jué)大會(huì)ICCV2021上舉辦的VOT 2021中再次披荊斬棘,包攬了五個(gè)賽道中兩項(xiàng)挑戰(zhàn)賽的冠軍:
VOT-RT2021(實(shí)時(shí)目標(biāo)跟蹤挑戰(zhàn)賽);
VOT-RGBD2021(顏色和深度的長(zhǎng)時(shí)跟蹤挑戰(zhàn)賽)。
VOT是國(guó)際目標(biāo)跟蹤領(lǐng)域最權(quán)威的測(cè)評(píng)平臺(tái),由于每年的評(píng)測(cè)序列都會(huì)更新,且標(biāo)注的精確度逐年提高,VOT競(jìng)賽也被視為視覺(jué)跟蹤領(lǐng)域最難的競(jìng)賽。VOT挑戰(zhàn)為跟蹤社區(qū)提供了一種精確定義和可重復(fù)的方法,用于比較短期跟蹤者和長(zhǎng)期跟蹤者,以及討論視覺(jué)跟蹤領(lǐng)域的評(píng)估和進(jìn)展的通用平臺(tái)。
視覺(jué)目標(biāo)跟蹤是計(jì)算機(jī)視覺(jué)中的一個(gè)重要研究方向,有著廣泛的應(yīng)用,如:視頻監(jiān)控,人機(jī)交互,無(wú)人駕駛等。傳統(tǒng)的目標(biāo)跟蹤算法采用相關(guān)性運(yùn)算方式來(lái)實(shí)現(xiàn)模板與搜索區(qū)域相似度的簡(jiǎn)單融合。然而,相關(guān)運(yùn)算本身是一個(gè)局部線性匹配過(guò)程,容易丟失語(yǔ)義信息,容易陷入局部最優(yōu),這可能是設(shè)計(jì)高精度跟蹤算法的瓶頸。
此次中科智云-大連理工聯(lián)合AI實(shí)驗(yàn)室提出了一個(gè)新的基于Transformer 跟蹤框架TransT-M,能有效的結(jié)合注意力機(jī)制把模板和搜索區(qū)域的特征信息融合起來(lái)產(chǎn)生一個(gè)高性能目標(biāo)跟蹤器。該注意力機(jī)制同時(shí)又融合了基于自我注意的自我上下文增強(qiáng)模塊和基于交叉注意力的跨特征增強(qiáng)模塊,確保長(zhǎng)距離跟蹤需要的充足的上下文有效信息,同時(shí)避免了不必要的信息干擾。實(shí)驗(yàn)表明,我們的 TransT-M 在六個(gè)具有挑戰(zhàn)性的數(shù)據(jù)集上,尤其是在大規(guī)模 LaSOT、TrackingNet 和 GOT-10k 基準(zhǔn)測(cè)試上,無(wú)論在精度還是效率遠(yuǎn)遠(yuǎn)超出了目前現(xiàn)有算法,取得了非常不俗的結(jié)果。目前該算法已經(jīng)納入到智云X-Brain平臺(tái)的目標(biāo)物體視頻模塊中使用,為X-Brain的客戶提供最好的體驗(yàn)。
中科智云近年來(lái)已經(jīng)先后在視頻跟蹤分割領(lǐng)域內(nèi)的多個(gè)國(guó)際挑戰(zhàn)大賽中獲得了領(lǐng)先的名次,標(biāo)志著中科智云在視頻目標(biāo)檢測(cè),跟蹤和分割技術(shù)等視頻智能分析的關(guān)鍵技術(shù)已處于業(yè)界領(lǐng)先水平。這些技術(shù)將在國(guó)內(nèi)外的智能建造、智慧城市、智慧農(nóng)業(yè)、智慧交通、智慧醫(yī)療等領(lǐng)域的5G+AR視頻業(yè)務(wù)中獲得廣泛應(yīng)用。
歷屆VOT獲獎(jiǎng)情況:
于2019年獲得 VOT-LT2019(Long-term tracking challenge,即長(zhǎng)時(shí)跟蹤挑戰(zhàn)賽)冠軍,
于2020年獲得三項(xiàng)挑戰(zhàn)賽的冠軍
VOT-RT2020(Short-term Real-time tracking challenge,即實(shí)時(shí)跟蹤挑戰(zhàn)賽)
VOT-LT2020(Long-term tracking challenge,即長(zhǎng)時(shí)跟蹤挑戰(zhàn)賽)
VOT-RGBD2020(Color and depth long-term tracking challenge。即顏色和深度的長(zhǎng)期跟蹤挑戰(zhàn)賽)
中科智云作為計(jì)算機(jī)視覺(jué)領(lǐng)域的“佼佼者”,擁有全球頂尖的AI技術(shù)研發(fā)能力,并已實(shí)現(xiàn)關(guān)鍵核心技術(shù)國(guó)產(chǎn)可控。目前已與牛津大學(xué)、帝國(guó)理工等全球知名院校成立7家聯(lián)合實(shí)驗(yàn)室;成立兩年來(lái),公司已申請(qǐng)近50件國(guó)內(nèi)國(guó)際AI專利,多次在全球頂級(jí)會(huì)議發(fā)布論文,并斬獲多個(gè)國(guó)際大賽佳績(jī)。