一、大数据概念
作为时下最火热的IT行业的词汇,随之而来的数据仓库、数据安全、数据分析、数据挖掘等等围绕大数据的商业价值的利用逐渐成为行业人士争相追捧的利润焦点。对于“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
具体来说大数据(bigdata)是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理、处理的数据集合。而更具广泛的理解是,大数据是通过诞生于各个终端、通过工具采集,并具备存储、分析这些庞大数据的能力。大数据的意义不仅仅是在掌握庞大的数据信息,而在于这些数据背后的“隐含内容”,其利益最大化的是数据加工、分析、挖掘在数据背后的“增值”信息。
大数据”这个术语最早期的引用可追溯到apache org的开源项目Nutch。当时,大数据用来描述为更新网络搜索索引需要同时进行批量处理或分析的大量数据集。随着谷歌Map Reduce和Google File System (GFS)的发布,大数据不再仅用来描述大量的数据,还涵盖了处理数据的速度。
早在1980年,著名未来学家阿尔文·托夫勒便在《第三次浪潮》一书中,将大数据热情地赞颂为“第三次浪潮的华彩乐章”。不过,大约从2009年开始,“大数据”才成为互联网信息技术行业的流行词汇。美国互联网数据中心指出,互联网上的数据每年将增长50%,每两年便将翻一番,而目前世界上90%以上的数据是最近几年才产生的。此外,数据又并非单纯指人们在互联网上发布的信息,全世界的工业设备、汽车、电表上有着无数的数码传感器,随时测量和传递着有关位置、运动、震动、温度、湿度乃至空气中化学物质的变化,也产生了海量的数据信息。
大数据具有四个特点:第一,数据体量巨大,从TB级别跃升到PB级别;第二,数据类型繁多,诸如日志、视频、图片、地理位置信息等;第三,价值密度低,商业价值高,大量数据中只有片段数据是有效的;第四,处理速度快,1秒定律。业界将其归纳为4个“V”--Volume,Variety,Value,Velocity。
二、金融安防领域的大数据
在安防行业,包括金融行业、平安城市、智能交通、政府机构、大型企业等目前存在着大量的“视频存储数据”,但这些数据之间没有任何联系与关联,只是简单的分布存储或集中存储,在金融行业中,如一个国有银行的二级分行,一般会有数千个视频监控点,视频存储数据量非常大,但这些数据很难关联,而是一种“孤岛式”的散存在各个前端存储设备之中。
在安防金融行业中,其海量数据的最重要组成部分是视频、图片类数据。因此金融安防监控大数据以视频类数据作为样本数据进行分析,这些视频类数据具有如下特点:
海量数据。随着安防高清化的应用,已经从TB级别跃升为PB级别,如果存储一路4M的720P图像,1个月就有1.236TB的实际存储空间需求。
数据类型众多,信息丰富。其内容涵盖日志信息、报警信息、视频数据、图片数据、声音数据等,这其中有些是结构化数据,有些是非结构化数据,还有半结构化数据。
单条监控数据的价值密度低,需要从海量数据中寻求一些最有价值的信息。如银行金库里某点的视频监控,其不间断的监控录像中,有价值的数据可能就几分钟或者几秒钟。
海量监控数据难以快速分析,而实际的需求是能及时处理,这样转换的价值才高。但现实的情况很难做到,必须依靠人工不间断的进行录像调阅。
目前金融行业视频联网工作已经进行了多年,已经实现各个“孤岛式”存储设备的远程调阅,但没有实现统一化的管理和应用,在使用这些存储数据时候,必须依靠各种已知信息到各个“孤岛式”存储设备进行定向访问。比如要在银行内所有视频数据中快速检索某人相关的录像数据,在目前这种安保系统方案的技术架构上,是难以实现的,再比如在银行中需要查询某个银行卡号关联的录像,首先到银行的相关部门获取此卡号办理过的柜台号或者ATM自助设备信息,然后进行定向查找,难以实现快速的查找和调阅应用。
三、云计算&云存储
提到大数据,不得不提到云计算的概念,这两者存在众多交集,“大数据离不开云”,支撑大数据的众多底层技术就是云技术。两者之间是一种绑定的关系,大数据概念是建立在云计算之上的。
云计算是一种通过网络以服务的方式,提供动态可伸缩的、虚拟化的资源计算模式。通过大量的分布式计算机,根据服务的需求访问计算机和存储系统等资源,而且这些资源是动态扩展且是可虚拟化的。
何谓云存储呢?云存储是云计算概念上延伸和发展的新概念,指通过集群应用,虚拟化、分布式文件系统等技术和功能,整合大量不同类型的存储设备,协同工作,共同对外提供数据存储和业务访问功能的一个系统,云存储是一个以数据存储和管理为核心的云计算系统。
大数据的分布式计算,都需基于储存、计算等资源的灵活应用。大数据没有海量数据的存储作为基础,也就不存在“大数据”应用之说。大数据快速的数据分析处理能力不采用云计算,似乎只有寻求超级计算途径了。除了云计算、云存储之外,信息感知采集与信息传输技术,视频智能分析,大数据挖掘等,这些都是安防行业大数据应用的重要组成部分。
四、金融安防信息数据集成
经过多年的发展,在金融安防中,包括视频监控子系统、入侵报警子系统、门禁控制子系统、网络对讲子系统、智能分析子系统、消防预警子系统、环境量监控子系统等众多系统从各个感知终端采集了海量信息。这些海量数据包括视频信号、报警信号、环境量信号以及日志信息、地理信息等各类数据。如何将这些海量信息数据进行集成呢?
金融安防信息数据的集成不是简单的信息搜集、无意义的堆叠,而是一种有规律的深度集成。是包括信息采集、适配、分析、关联、处理、存储等多个阶段,将各种无序的数据形成有规则模型的集成管理信息,将各种结构化数据和非结构化数据形成有关联关系的海量数据信息,其后的存储与管理工作可以通过前面所述的云存储实现。
金融数据集成的必要性、重要性不言而喻,其在大数据战略规划中处于核心的地位,数据集成应用其集成的数据范围,集成的传输设计,集成的架构设计,集成的业务应用范围都是重要组成部分。前面提到大数据与云计算是绑定的,而大数据与信息集成是互存发展的。数据集成需通过大数据应用分析、挖掘等来体现其数据集成背后的价值,反之大数据的构建需要依靠数据集成技术进行支撑。
五、大数据应用的难点与机会
长期以来,金融行业对安防技术的应用一般都是走在前沿,往往都采用了当时最先进、最前沿的技术和设备,金融安防应用趋势基本上代表了安防行业的整体发展趋势。
而近几年,随着安防设备高清化、网络化、智能化发展与应用的日趋成熟,云存储、云计算、大数据等产品不断在市场试水,而金融行业安防面对这些新技术时,更多的选择了观望或是试点性应用,其实金融行业自身对于高清应用的需求非常迫切,出现这种状态的原因可以银行为例进行分析:
高清化后的存储容量增加。视频监控高清化是智能分析的基础。标清的
4CIF码流,按照码流1.5Mb/s计算,30天需要存储容量为0.4635TB,常见的720P高清,按照码流4Mb/s计算,这样30天就有1.236TB,相当于存储容量需要翻2.67倍。因此高清化后的存储容量出现几何级的增长,需要更多存储空间,这就需要更多存储设备。
银行网点带宽制约。这也是银行长期以来网络化、高清化发展中最大的障碍,很多银行的监控专用带宽仍为2~4M,如果将带宽提速,银行将会增加大量的租赁费用,如果不进行提速,未来大数据的统一管理与存储将在带宽上遇到瓶颈。
高性能计算框架的缺失。目前诸如开源如hadoop等大数据框架,基本是源于互联网行业的框架,不是针对视频监控领域,不适合处理流式数据。比如在海量数据存储的文件系统,其中文件颗粒度、文件格式必定与传统的文件系统有很大区别,同时在面向行业应用方面,安防行业需要类似视频、图片个性化的基础应用功能,如关键帧数据信息、智能预分析数据的存储等,因此直接照搬互联网行业应用不现实。
缺少足够的应用需求。银行安防对大数据的业务需求没有涌现出来,大数据分析、挖掘模型难以抽象出来,很难去推动大数据在金融行业的应用,相信未来必定会出现类似的需求。
虽然存在上述的众多难点,但并不意味着大数据在金融安防行业没有发展的机会,也存在下面几点有利条件:
安防企业如海康威视就已经推出自己的大数据解决方案。国内的大数据应用方案开始被广泛提出,大数据作为安防行业未来重要的发展方向,有研发实力的安防厂家也开始构建专为相关行业应用优化的大数据解决方案以及高性能计算框架方案,未来的大数据不仅仅是一个概念,也会开始走向实际应用。
高清化与网络带宽未来不会成为瓶颈。高清已出现了高压缩算法,720P可以压缩到2Mb/s,而传统的标清4CIF是1.5Mb/s,这样对于存储空间的需求不会出现几何级的增长。随着“三网融合”等进程,未来的网络系统肯定会朝着专网或者大型的光纤网路方向发展,网络制约也许就不存在了。
云计算、云存储开始在安防领域实施、落地,为后续大数据应用做了很好的基础铺垫。国内已经出现安防行业专业的视频云计算、云存储产品,并且陆续在项目中实际应用,诸如海量的视频数据存储,海量数据的快速检索,海量视频的视频分析等应用都成为现实。
六、总结
金融行业安防中的高清时代已经到来,产生的视频数据越来越多,但目前金融行业的大数据时代仍未全面到来,大量的数据仍然是独立的、零散的,包括网络、系统平台等在内的基础实施仍无法满足视频数据的统一管理及存储,同时视频分析等相关的核心技术仍然需要发展。目前,诸如人脸识别等智能分析的精确度仍需要提高,而最重要的是金融安防对于安防数据应用的业务需求,这才是推动大数据在金融安防发展的根本原因,例如平安城市的刑侦应用,其视频大数据有着非常明确的应用。
大数据不是一个全新的技术,但大数据在金融行业想真正的应用和落地还是有一定困难,目前相对做的比较好的是采集、存储和管理,而分析、掘等方面还有很长一段路要走。
微信扫描二维码,关注公众号。