技术动态 > 正文
大华股份AI场景流、光流技术取得新进展
2020/9/23 15:43   大华股份      关键字:大华股份 AI 场景流 光流      浏览量:
大华面向用户需要开放全栈能力,赋能行业生态,并在实战中持续积累人工智能核心技术,针对全场景理解、小规模数据、泛化能力、多任务学习和AutoML等人工智能的技术挑战,开展实践探索,并已取得实战应用成果。
  近日,大华股份基于AI的场景流估计算法和光流估计算法再次取得突破性成果,各项指标再次刷新了KITTI Sceneflow、KITTI Flow两项竞赛的全球最好成绩:场景流和光流的3像素错误率指标分别为5.06%、3.79%,指标均创历史新高,持续保持领先水平。
 
大华股份AI取得KITTI Sceneflow排行榜第一
 
大华股份AI取得KITTI Flow排行榜第一
 
  场景流算法可同时估计场景中物体的三维位置与三维运动矢量,光流是场景流映射到二维图像坐标系的投影,应用价值广泛。为提升场景流估计精度,大华AI团队优化了一系列算法模块。首先,基于yolact++网络进行实例分割,从场景中分割出行人、车辆、自行车等前景目标,然后基于最新架构的GANet计算初始视差图,得到更精细的视差图,在使用RAFT网络得到精细光流图,最后通过多阈值融合等策略,进一步优化场景流估计结果。
 
  在测评中,场景流和光流算法的效果和计算结果如下:
 
▲输入图像
 
▲T0时刻视差图
 
▲经光流映射后的T1时刻视差图
 
▲T1时刻到T0时刻的光流图
 
▲场景流误差图
 
  该项技术已在大华双目摄像机、全景摄像机等设备中得到应用,提升多目摄像机的目标深度数据计算、目标行为分析等算法性能;同时,该技术也成功应用于AR融合领域,实现单个及多个摄像机图像的AR语义融合应用,极大提升了行业解决方案的用户体验。
 
  双目摄像机行为检测应用场景
 
▲双目图像图
 
▲视差图
 
▲光流图(目标三维运动矢量)
 
  AR语义融合应用场景
 
▲真实图像
 
▲AR语义融合,增强目标类别、位置、运动矢量等信息
 
  近年来,在算法商业化落地方面,大华积极应用主导个性化AI方案敏捷交付,构建人工智能端到端研发的全链路能力,实现AI从基础能力到算法研发到产业化应用落地,构建了围绕视图智能、3D智能、多维智能、控制智能等核心算法体系,实现了在各业务领域的人工智能算法、产品与解决方案的全面覆盖,赋能百行百业。
 

 
  大华面向用户需要开放全栈能力,赋能行业生态,并在实战中持续积累人工智能核心技术,针对全场景理解、小规模数据、泛化能力、多任务学习和AutoML等人工智能的技术挑战,开展实践探索,并已取得实战应用成果。
 
  未来,大华股份将继续推动AI技术与各行业场景的深度融合,充分发挥科技创新对百行百业可持续发展的支撑引领作用,推动AI等新一代技术的普及与落地,赋能百行百业数字转型升级。

微信扫描二维码,关注公众号。