大华股份AI斩获场景流和光流两项国际竞赛第一-技术动态-中国安全防范产品行业协会

不断刷新纪录大华股份AI斩获场景流和光流两项国际竞赛第一

2018/9/27 10:24 中国安防行业网 关键字：大华,光流,场景,股份,竞赛,图像浏览量：

在本次比赛中，大华股份AI团队为提升场景流估计精度，增加了一系列算法模块。首先，基于Mask-RCNN网络进行实例分割，从场景中分割出行人、车辆、自行车等前景目标。接下来，基于GC-Net计算初始视差图，使用分段多权重loss函数、利用实例分割结果和多尺度特征图优化初始视差结果，得到更加精细的视差图，进而改善了初始的proposal NRT集合。

继50天内拿下4个世界纪录后，近日，大华股份再次刷新KITTI Sceneflow和KITTI Flow两项竞赛的全球最好成绩，采用基于实例分割、深度视差网络、刚体运动一致性约束的场景流估计算法，超越了其它一流AI公司和顶尖的学术研究机构，以及ICCV、ECCV、CVPR相关论文中的场景流研究成果，这标志着大华股份在场景流与光流两个算法领域均具有重要国际影响力。

大华股份取得KITTI Sceneflow排行榜第一名：

(网址: www.cvlibs.net/datasets/kitti/eval_scene_flow.php)

大华股份取得KITTI Flow排行榜第一：

(网址: www.cvlibs.net/datasets/kitti/eval_scene_flow.php?benchmark=flow)

关于KITTI：KITTI数据集由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办，是目前国际上最大的计算机视觉算法评测数据集之一。数据集用于评测立体匹配(stereo)、光流(flow)、场景流(sceneflow)、视觉里程计(visual odometry)、物体检测(object detection)和跟踪(tracking)、道路分割(road)、语义分割(semantics)等计算机视觉技术的性能。KITTI包含市区、乡村和高速公路等场景采集的真实图像数据，每张图像中最多包含15辆车和30个行人，且存在不同程度的遮挡与截断。

场景流与光流：

场景流算法能够同时估计场景中物体的三维位置与三维运动矢量，是感知环境空间几何结构的核心算法，与感知语义信息的算法结合后，能够全面地理解环境。三维场景流的估计结果能够进一步分解为立体匹配结果与光流匹配结果，可以认为，光流是场景流映射到二维图像坐标系的投影。

在评测中，采用场景流和光流算法的效果和计算结果如下所示：