中国安防行业网

首页 > 行业研究 > 正文

关于智能视觉监控技术的研究
2006/7/26 9:59:00      本站编辑   关键字:      浏览量:
院自动化所所长谭铁牛组织的IEEE视觉监控专题讨论会也已经成功地举办了三届。收录了大量智能视觉监控领域内的最新研究成果。

    院自动化所所长谭铁牛组织的IEEE视觉监控专题讨论会也已经成功地举办了三届。收录了大量智能视觉监控领域内的最新研究成果。 

    智能视觉监控的研究对象很广泛,理论上说,凡是动态场景中的运动目标都可以作为被研究对象,相应的研究方法也很类似,本文以交通场景为例,对基于交通场景的智能视觉监控的研究现状作简要的介绍。 

    视觉监控中的车辆的定位与跟踪算法大致可分为如下四类,值得注意的是,这种分类不是绝对的,各种方法之间可以互相的借鉴和融合。基于区域的方法、基于主动轮廓的方法、基于特征的方法、基于模型的方法;从另一个角度看,也可以分为基于二维的方法和基于三维模型的方法。对于这些方法,尤其对于基于二维的方法,本身具有固有的缺陷,如:难以解决遮挡、无关结构干扰、对光线敏感、适用场景有限等问题,而对于采用基于三维模型的方法来说,由于引入了目标物体的三维先验知识,所以从本质上来讲,比基于二维的方法更具鲁捧性和准确性,但是相应的研究的难度也更大。目前国际上的研究组大多采用基于二维的方法,采用基于三维模型的方法的研究组比较少,具有代表性的研究组有英国雷丁大学计算机系的VIEWS 项目组和德国卡尔斯鲁厄大学计算机系H.H.NAGEL博士领导的研究组。 

    中国科学院自动化研究所模式识别国家重点实验室谭铁牛研究员从20世纪90年代初就开始研究基于三维模型的智能视觉监控系统,领导视觉监控小组,针对系统中若干关键性问题,进行了深入的研究和探讨,提出了自己的见解和主张,取得了一系列的研究成果,在国际计算机视觉领域权威期刊如IJCV和重要国际会议如ICCV上发表 了数十篇论文,在IEEESMC上作了有关视觉监控的特邀报告。 

    基于三维模型的交通监控系统 

    计算机视觉界中传统的Marr视觉理论认为,视觉过程是从下到上的处理过程,但实际上,人类在观察周围世界的时候,总是利用丰富的先验知识,这就启发我们恰当地引入先验知识,提高系统的性能。先验知识包括很多方面,如车辆模型、场景模型、运动模型、弱透视模型、地平面约束、推理结构和语法与句法模型等等,其中最重要的是车辆模型。我们实现生成一个车辆的三维线框模型,在给定的姿态下,将其投影到图像平面上,并与图像数据匹配。通过优化过程得到目标物体的真实姿态,这类方法,我们称之为基于三维模型的目标定位方法。 

    中科院自动化所模式识别国家重点实验室视觉监控小组总结了英国雷丁大学 VIEWS的车辆交通监控原型系统的研究经验,在以往的理论研究的基础上,自行设计了一个拥有完全自主版权的交通监控原型系统VStar Visual SurveillanceStar,并在PC Windows 2000平台上用Visual C++6.0语言初步实现了整个系统。 

    从硬件组成上看,整个VStar系统由计算机、数字摄像机、音箱和交通场景模拟平台组成。当车辆在交通场景中运动时,摄像机将拍录下来的视频序列送进计算机;定位和跟踪程序自动分析这些视频序列,识别车型并跟踪车辆在场景中的运动;跟踪结果被送进行分析和语义解释程序,对车辆的行为进行分析并给出语义解释;如果需要的话,语义解释结果进一步被送进语音合成程序,得到语音提示或警告。比如,当车辆逆向行驶或闯入草地时,系统给出准确的语音警告。目前该系统能够在一台PⅢ866PC机上实时地跟踪车辆,对光线变化、无关结构的干扰斑马线、边界遮挡具有很强的鲁捧性。 

    该系统对视觉监控理论算法和系统实现的研究奠定了重要基础。 

    研究展望 

    由于智能视觉监控这项研究重要的理论价值和应用价值,目前已经成为世界上的研究热点,需要解决的问题也很多。理论上,我们将在姿态评价函数形式与优化方法、目标定位跟踪和预测的统一概率框架、语义推理结构与模式学习、多媒体化描述等方面继续展开深入的研究。 

    在实践上,将升级现有的VStar原型系统,完善各项功能模块,如设计更鲁棒的算法、实现多目标的实时跟踪、设计多机网络化硬件框架、引入多摄像机系统、完善知识库等等。还可以基于特定的场合,如高速公路、停车场、高级社区等,实现实用化的智能视觉监控产品。

相关专题:

相关新闻:
加载中...
加载中...