高端访谈 > 正文
博云视觉CEO陈杰:利旧传统安防系统 立新视觉检索引擎
2019/5/17 08:59   TechWeb      关键字:视觉,视频,安防,数据,利旧,城市      浏览量:
05-1419:55文/行者崟涛【TechWeb】智慧城市,将如同人类大脑一样运作。传统意义上,摄像头是城市的“眼睛”,云端视频系统则是城市的“视觉中枢”。智慧视觉作为城市发展重点,却面临来自数据承载能力的阻碍,公共安全领域迫切需要一种视频处理方案。今天,人工智能等技术似乎为我们提供了

文/行者崟涛

智慧城市,将如同人类大脑一样运作。传统意义上,摄像头是城市的“眼睛”,云端视频系统则是城市的“视觉中枢”。智慧视觉作为城市发展重点,却面临来自数据承载能力的阻碍,公共安全领域迫切需要一种视频处理方案。今天,人工智能等技术似乎为我们提供了一项可行思路。TechWeb针对这个问题,与博云视觉CEO陈杰进行了讨论。

   突破带宽瓶颈 新旧架构升级

TechWeb:目前安防领域的视觉处理系统遇到了哪些技术瓶颈?

博云视觉CEO陈杰:目前来看,安防视频的大规模应用面临带宽瓶颈。前端的摄像机将成像数据发给云端,让云端负责编码,但矛盾是传输带宽有限。而随着安防需求增大,一座城市视觉的需求在过去几年从几万路逐渐增长到几十万路,视频传输通道面临“带宽瓶颈”。目前一种解决方案是:将旧的“存储”架构需要升级到新的“处理”架构。

实际上,这是一个缓慢的升级过程。传统视频监控系统重点面向“存储”和“调阅”,检索信息依然靠人力;未来智能化摄像则面向与处理层级与检索层级。如果我们将电子摄像头比作人眼视网膜,其功能应该有二:一是成像,一是信息理解。智慧化升级是完善城市“前端视网膜”功能的过程,应减少人脑的重复性工作。博云视觉尝试在前端去做实时特征抽取,并在云端部署大规模视频搜索引擎。

海量视频搜索或成刚需

陈杰:视频轻量级处理模型是传统摄像头升级的基础技术。

智能摄像头有三项功能:第一,智能摄像头需要做视频编解码。第二,要做视频内容的实时特征抽取,这些特征包括人脸、车辆等信息。第三,前端还要对时空信息(时间戳、空间戳)进行汇聚,为面向处理的云端架构做铺垫,以便后期按需调取视频。

这样一来,大量运算成本分摊到了“视网膜”端,给传输带宽压力降低。能够实现以上功能的安防终端是目前主流产品思路,大大避免了人工检索的重复性劳动。现在无论城市视频存储有多大,可以通过“时间、空间、人物”进行精准索引,特征化处理的信息可以降低带宽要求、减小数据总量、提高检索速度。

陈杰还讲到,前端做视频流特征处理,结合后端的搜索引擎,是目前博云视觉为提升海量数据处理效率的方案之一。

博云视觉的其中一项核心业务,就是做大规模流式数据搜索。与传统数据库(文本比对)不同,视频的非结构化数据(向量数据)搜索是传统数据库没法介入的工作。百亿级的体量、非结构化的数据、流式数据吞吐,分布在城市各个角落的摄像头承载着海量上下行流量,这为视频2搜索带来了不小挑战。

为此,博云视觉推出了一款分布式大规模流式矢量特征搜索引擎,能够应对千亿级数据量。

兼容型引擎:利旧,立新

市场往往是滞后于技术的。TechWeb:博云目前在做通用型视频搜索引擎么?

陈杰:首先,人工智能企业依赖数据质量,数据清洗和数据标注变成了一家公司的技术门槛,针对不同产品、场景需要非常垂直的数据积累,包括博云内部也开发了一款提升数据标注效率的工具,降低了数据成本。

在数据支撑下,博云希望做面向全行业的兼容型引擎,例如将旷视的人脸数据,放在博云的搜索引擎上也可以解析。甲方市场不希望被“技术绑架”,反而更希望将众多城市项目分包给多家企业,让企业之间实现互联互通,形成生态。按照这个思路,博云尝试将人脸识别技术中通用的架构提取成标准,专业架构留足弹性空间给各个厂家,从而间接支撑甲方需求。

基于深度学习的轻量级前端特征提取,可以分为多层,前几层占用几乎占用了90%的算力,这些部分就可以交给前端去运行,特征信息交给后端,在此基础上进行Fine-tuning(微调),针对各家模型与数据进行最终优化。

而陈杰认为,在前端完成运算更适用于城市场景,带有一定算力的摄像机会成为主流趋势。视频编码过程是有损的,典型的压缩编码算法(H.264)会压到原数据1/300左右。现阶段做视频边缘计算是可行的“利旧”方案:旧相机没有算力,边缘服务器与之互补。

现实情况下,行业现有的算法水平复杂度大,4K的图像需要压制成720P才能处理,识别结果并不理想。“取巧”方法是前端采集4K或是8K分辨率视频,压制为普通分辨率后再做特征提取,虽然减轻了算力压力,但属于自欺欺人的做法,没有实际效果的提升。

博云视觉早期以图像搜索业务起家,早在2011年,这几公司刚刚突破了“大M:大N”的物体搜索核心技术,而那个时候,还没有应用深度学习模型。

公共安全场景中,常见的方式是将过往行人与嫌犯数据库比对,博云视觉提出的解决方案,可以在案件发生后辅助安全部门追捕逃犯,追踪其行为、记录其行为内容、运动轨迹,从而最快速度的找到嫌犯位置。

目前,博云已经在青岛、贵阳、长沙三个城市落地视频搜索项目。据悉,相关的科研项目团队由博士牵头。

关于资本环境

当TechWeb问到“是否会选择科创板”时,陈杰果断地表示:“博云视觉,会的”。

陈杰回答“未来登陆科创板”问题时讲到:科创板鼓励人工智能企业,并且鼓励自主研发。博云视觉的产品均为自主研发,技术研发占高,非常希望未来两到三年进入科创板市场。

微信扫描二维码,关注公众号。