杭州2018年9月11日電 /美通社/ -- 人工智能技術(shù)的快速發(fā)展加速物聯(lián)網(wǎng)行業(yè)的升級,視頻結(jié)構(gòu)化智能解析技術(shù)能夠從海量視頻數(shù)據(jù)中提取價值數(shù)據(jù),供進一步數(shù)據(jù)分析和挖掘,為精準決策提供基礎保障,賦能公安、交通、金融、樓宇、零售等各個行業(yè)應用。
近日,大華股份基于深度學習技術(shù)研發(fā)的目標檢測技術(shù),刷新了KITTI 2D Object Detection (Pedestrian)競賽的全球較好成績,取得了人體目標檢測排行榜第一名,超越其它一流的 AI 公司和頂尖的學術(shù)研究機構(gòu),以及 ECCV 和 CVPR 較佳目標檢測研究成果,這標志著大華股份在目標檢測領域處于世界領先水平。
大華股份在 AI 的核心技術(shù)領域持續(xù)耕耘,不斷提升智能算法、算力的核心競爭力。這是大華股份繼2018年取得 KITTI 國際競賽車輛目標檢測第一名之后,再次在人體目標檢測領域取得重大突破。前不久,大華股份行人多目標跟蹤技術(shù)在 MOT Challenge 國際測評中取得第一的好成績。
KITTI 數(shù)據(jù)集由德國卡爾斯魯厄理工學院和豐田美國技術(shù)研究院聯(lián)合創(chuàng)辦,是目前國際上較大的計算機視覺算法評測數(shù)據(jù)集之一。數(shù)據(jù)集用于評測立體圖像 (stereo),光流 (optical flow),視覺測距 (visual odometry),物體檢測 (object detection) 和跟蹤 (tracking) 等計算機視覺技術(shù)在車載環(huán)境下的性能。KITTI 包含市區(qū)、鄉(xiāng)村和高速公路等場景采集的真實圖像數(shù)據(jù),每張圖像中最多包含15輛車和30個行人,且存在不同程度的遮擋與截斷。
2D人體目標檢測任務
該任務中的行人數(shù)量多,且有大量遮擋截斷的情況,行人尺度、角度變化多,目標檢測難度較大。大華股份最終以78.29%的準確率位列第一。
本次競賽在大華自主研發(fā)的深度學習平臺上,汲取了 ResNet 等網(wǎng)絡結(jié)構(gòu)的優(yōu)點,改進了深度學習檢測算法框架,采用強化學習等訓練技巧,并運用多模型融合技術(shù),大幅提升了遮擋目標和小目標的檢出率。
該競賽數(shù)據(jù)集的行人檢測效果圖如下:
本次競賽中使用的技術(shù)已經(jīng)在大華的客流分析、人群態(tài)勢、視頻結(jié)構(gòu)化解析、周界管理、智能交通等產(chǎn)品和解決方案上得到廣泛應用。