随着视频监控系统在公安、交通等敏感领域的大规模应用,电子眼帮助破案的报道时有所耳闻。一方面,这些事例从正面体现了视频监控系统的社会价值;另一方面,也引发了更多的关于视频检索的深层次需求。在实际应用的过程中,用户常常希望可以快速的从海量的数以万计的摄像头视频录像中,方便的找到一些有明显特征的人或物。传统的基于预设告警和时间的视频检索方式,对于这类深层次的需求往往无能为力,常有“隔靴搔痒”之憾,因而如何快速准确的进行智能的检索就成为大型视频监控系统需要解决的重要课题。
传统海量存储技术的应用瓶颈
就平安城市这样的大型视频监控系统而言,每时每刻系统中都有海量的视频在进行存储。这些视频对于打击犯罪,保卫人民生命财产安全是至关重要的。目前基于分布式的系统构架设计的大型视频监控平台,采用分治的方法,综合使用前端存储(NVR/DVR),后端存储(存储服务器、磁阵等)等多种策略结合。从技术上看,已经可以比较稳妥的解决海量视频的存储问题。但是,主流的基于时间点和预设事件的检索方式相对于当前复杂的治安形势就过于简单了。下面以一个现实中的检索需求为例,对传统的检索方式进行分析。
检索需求:检索在10:00到12:00,出现在某银行正门附近的,穿白色衬衫的男子。
为实现找到符合条件的视频,在传统视频存储系统中,将需要很多人力进行人工分析。传统监控系统可以通过GIS比较准确的找到XX银行正门附近的摄像机,通过时间检索找到相关的视频,之后就需要靠人力进行人为调看,即使在16倍速的高速浏览下,进一步找到相关视频也是一件十分浪费人力和时间的事情,而且由于人的参与,长时间观看导致漏检的风险很大。
我们可以看到,在实现这一检索需求时,传统的检索方式显得比较笨拙。检索检索方式不够“聪明”,这已经成为传统大型监控系统应用中的一个瓶颈。
考虑到具体案件的复杂性,今天关于“白衬衣”的要求,明天可能变为“花衬衫”,所以用户不仅要求检索更加“聪明”,而且也要足够“灵活”。当然,用户还希望系统能够尽快完成查询。那么,我们可以将用户对海量视频存储系统的检索要求归纳为“更聪明”、“更灵活”、“更快捷”。
使用智能分析技术提升检索算法有效性
引入智能视频分析技术实现“聪明”和“灵活”
既然,用户迫切需要检索更加“聪明”,那么使用智能分析技术提高系统的“智商”就势在必行了。
目前应用于视频监控的的智能视频分析技术可以归纳为:目标提取技术、目标分类(识别)技术以及规则判断技术等3个彼此依存的技术谱系。这3类技术构成了智能视频分析系统的3大基本模块:目标提取模块、分类识别模块、规则判断模块。
首先,数字视频流经过视频解码,解码为智能视频分析系统可以识别的视频或图像序列,作为智能视频分析系统的输入。分析系统首先使用目标提取输入图像序列进行前背景分离,完成目标提取工作;比较复杂的智能视频分析系统一般带有分类功能,可以对识别出来的目标进行模式识别,分辨出目标的更多属性,如比较常见的分类器包括:人车分类,颜色分类、行为分类等;此后系统将被提取的目标和与之分类信息,交给规则判断模块,进行规则推理,如果违反了某些设定的规则,系统将输出告警。
将上文提到的检索需求套入到上述流程中,可以发现现有的智能视频分析技术在“理论”上能够帮助完成这个需求。“白色衬衣、男子”这些是对分类识别模块的识别要求,同时也是判断推理模块中的规则。也就是说所谓的更“聪明”对应于智能视频分析技术就是要求分类识别模块更强大;检索的需求一定是会不断变化的,比如“白衬衣”变成“花裙子”,“男子”变为“女子”,“灵活”的要求需要规则判断模块来完成。
这个系统模型在传统海量存储系统上增加了智能视频分析功能,从而完成了使系统变得“聪明”了。
当用户发起查询时,首先通过规则生成器,将查询要求翻译成规则,输入规则推理模块,之后系统对相关视频进行智能分析,也就是进行目标提取和目标分类识别,同时规则推理判断,找出符合要求的视频。
这个模型借助智能视频分析技术,可以提升查询系统的“智商”,实现用户关于“聪明”和“灵活”的诉求,但是这个系统的效率如何呢?还有一个问题需要考虑,就现在的智能视频分析技术而言是否能够有足够精确的目标提取、模型匹配的精准算法从而来判断“男女”,区分“白色衬衫”和“白色风衣”的不同。这些问题在现有的分析技术和算法模型中都是很难解决的,综上,这个模型存在的问题表现在:
一是效率较低,查询速度取决于分析速度。
二是对于实际应用中的现实要求,智能技术又无法达到的情况没有进行处理。
使用视频分析技术构建“线索”数据库
之所以效率较低,主要是因为需要将可能存在的目标进行智能分析,智能分析算法需要时间来完成。这一过程限制了这一模型的效率。
实际上,对于这一问题我们可以通过增加实时视频智能分析服务器的办法,对实时视频在存储的同时进行智能分析,同时将目标提取模块、分类识别模块输出的结果保存到数据库中,以提升检索的效率。这个思路与google所采用的视频检索技术比较类似,只是提取目标和分类分析的视频源不同,进行预处理的时机不同。至此,得到了一个新的模型。
新模型将智能分析的运算分摊到视频传输和存储的过程中,并引入了数据库将视频分析的结果和源视频的存储位置关联关系一并保存到数据库中,提升了整个检索的反应速度。
当然这个基于智能视频的预处理过程也可以由终端设备完成,至于终端设备如何目标提取模块、分类识别模块分析的结果发送给视频监控平台,可以参考OnVif协议中的相关部分。
查询时,首先模型2针对查询条件,进行转换,将查询条件转换为系统可支持的规则,根据规则生成对数据库的查询语句进行查询,之后根据查询结果,找到相关的视频。
关于“误中”与“漏检”
鉴于当前智能视频分析技术的现状,在上述检索需求:“检索在10:00到12:00,出现在某银行正门附近的,穿白色衬衫的男子”中,至少衬衣和男子是比较难以分辨的,考虑到光照等因素,白色的分辨也存在一定困难。
也就是说,即使使用了智能分析技术,由于其分类识别模块的限制,对于一些查询需求,也是存在误中和漏检可能性的。对于实际应用而言,漏检的危害要大于误中,基于此,有必要引入一些基于概率论的方法,如贝叶斯方法,来缓解“漏检”的压力。
结束语
综上所述,智能视频分析技术的引入可以极大的提升原有海量监控视频存储系统的检索效率和命中率。但是,限于目前智能视频分析技术的现状,这一方案中还存在一些技术风险。虽然可以借助一些概率方法,引入类似“相似度”的概念来缓解“漏检”的风险,这一方案的离最终的用户要求还有一段距离。然而,从另一个角度看“距离产生美”,技术之所以引人入胜,很大程度上就是因为“距离”的存在。有理由相信,随着行业的快速发展,在海量监控视频存储系统上,引入智能分析技术将成为一种趋势。
微信扫描二维码,关注公众号。