博云视觉CEO陈杰：利旧传统安防系统立新视觉检索引擎-高端访谈-中国安全防范产品行业协会

博云视觉CEO陈杰：利旧传统安防系统立新视觉检索引擎

2019/5/17 08:59 TechWeb 关键字：视觉,视频,安防,数据,利旧,城市浏览量： 1958

05-1419:55文/行者崟涛【TechWeb】智慧城市，将如同人类大脑一样运作。传统意义上，摄像头是城市的“眼睛”，云端视频系统则是城市的“视觉中枢”。智慧视觉作为城市发展重点，却面临来自数据承载能力的阻碍，公共安全领域迫切需要一种视频处理方案。今天，人工智能等技术似乎为我们提供了

文/行者崟涛

智慧城市，将如同人类大脑一样运作。传统意义上，摄像头是城市的“眼睛”，云端视频系统则是城市的“视觉中枢”。智慧视觉作为城市发展重点，却面临来自数据承载能力的阻碍，公共安全领域迫切需要一种视频处理方案。今天，人工智能等技术似乎为我们提供了一项可行思路。TechWeb针对这个问题，与博云视觉CEO陈杰进行了讨论。

突破带宽瓶颈新旧架构升级

TechWeb：目前安防领域的视觉处理系统遇到了哪些技术瓶颈？

博云视觉CEO陈杰：目前来看，安防视频的大规模应用面临带宽瓶颈。前端的摄像机将成像数据发给云端，让云端负责编码，但矛盾是传输带宽有限。而随着安防需求增大，一座城市视觉的需求在过去几年从几万路逐渐增长到几十万路，视频传输通道面临“带宽瓶颈”。目前一种解决方案是：将旧的“存储”架构需要升级到新的“处理”架构。

实际上，这是一个缓慢的升级过程。传统视频监控系统重点面向“存储”和“调阅”，检索信息依然靠人力；未来智能化摄像则面向与处理层级与检索层级。如果我们将电子摄像头比作人眼视网膜，其功能应该有二：一是成像，一是信息理解。智慧化升级是完善城市“前端视网膜”功能的过程，应减少人脑的重复性工作。博云视觉尝试在前端去做实时特征抽取，并在云端部署大规模视频搜索引擎。

海量视频搜索或成刚需

陈杰：视频轻量级处理模型是传统摄像头升级的基础技术。

智能摄像头有三项功能：第一，智能摄像头需要做视频编解码。第二，要做视频内容的实时特征抽取，这些特征包括人脸、车辆等信息。第三，前端还要对时空信息（时间戳、空间戳）进行汇聚，为面向处理的云端架构做铺垫，以便后期按需调取视频。

这样一来，大量运算成本分摊到了“视网膜”端，给传输带宽压力降低。能够实现以上功能的安防终端是目前主流产品思路，大大避免了人工检索的重复性劳动。现在无论城市视频存储有多大，可以通过“时间、空间、人物”进行精准索引，特征化处理的信息可以降低带宽要求、减小数据总量、提高检索速度。

陈杰还讲到，前端做视频流特征处理，结合后端的搜索引擎，是目前博云视觉为提升海量数据处理效率的方案之一。

博云视觉的其中一项核心业务，就是做大规模流式数据搜索。与传统数据库（文本比对）不同，视频的非结构化数据（向量数据）搜索是传统数据库没法介入的工作。百亿级的体量、非结构化的数据、流式数据吞吐，分布在城市各个角落的摄像头承载着海量上下行流量，这为视频2搜索带来了不小挑战。

为此，博云视觉推出了一款分布式大规模流式矢量特征搜索引擎，能够应对千亿级数据量。

兼容型引擎：利旧，立新

市场往往是滞后于技术的。TechWeb：博云目前在做通用型视频搜索引擎么？

陈杰：首先，人工智能企业依赖数据质量，数据清洗和数据标注变成了一家公司的技术门槛，针对不同产品、场景需要非常垂直的数据积累，包括博云内部也开发了一款提升数据标注效率的工具，降低了数据成本。

在数据支撑下，博云希望做面向全行业的兼容型引擎，例如将旷视的人脸数据，放在博云的搜索引擎上也可以解析。甲方市场不希望被“技术绑架”，反而更希望将众多城市项目分包给多家企业，让企业之间实现互联互通，形成生态。按照这个思路，博云尝试将人脸识别技术中通用的架构提取成标准，专业架构留足弹性空间给各个厂家，从而间接支撑甲方需求。

基于深度学习的轻量级前端特征提取，可以分为多层，前几层占用几乎占用了90%的算力，这些部分就可以交给前端去运行，特征信息交给后端，在此基础上进行Fine-tuning（微调），针对各家模型与数据进行最终优化。

而陈杰认为，在前端完成运算更适用于城市场景，带有一定算力的摄像机会成为主流趋势。视频编码过程是有损的，典型的压缩编码算法（H.264）会压到原数据1/300左右。现阶段做视频边缘计算是可行的“利旧”方案：旧相机没有算力，边缘服务器与之互补。

现实情况下，行业现有的算法水平复杂度大，4K的图像需要压制成720P才能处理，识别结果并不理想。“取巧”方法是前端采集4K或是8K分辨率视频，压制为普通分辨率后再做特征提取，虽然减轻了算力压力，但属于自欺欺人的做法，没有实际效果的提升。

博云视觉早期以图像搜索业务起家，早在2011年，这几公司刚刚突破了“大M：大N”的物体搜索核心技术，而那个时候，还没有应用深度学习模型。

公共安全场景中，常见的方式是将过往行人与嫌犯数据库比对，博云视觉提出的解决方案，可以在案件发生后辅助安全部门追捕逃犯，追踪其行为、记录其行为内容、运动轨迹，从而最快速度的找到嫌犯位置。

目前，博云已经在青岛、贵阳、长沙三个城市落地视频搜索项目。据悉，相关的科研项目团队由博士牵头。

关于资本环境

当TechWeb问到“是否会选择科创板”时，陈杰果断地表示：“博云视觉，会的”。

陈杰回答“未来登陆科创板”问题时讲到：科创板鼓励人工智能企业，并且鼓励自主研发。博云视觉的产品均为自主研发，技术研发占高，非常希望未来两到三年进入科创板市场。

婢圭増妲戦敍姘拱閺傚洦澧嶉柊宥呮禈閻楀洤娼庨弶銉ㄥ殰娴滃海缍夌紒婊愮礉婵″倷闀滈悩顖氬煂閹劎娈戦弶鍐抄閿涘矁顕崣濠冩娑撳孩鍨滄禒顒冧粓缁紮绱濋懕鏃傞兇閻絻鐦介敍锟�010-88820951

微信扫描二维码，关注公众号。

智能化+大数据赋能我国安检产业迈进2.0时

多项赛事接踵而来新技术赋能下安防正与体

瀵邦喕淇婇幍顐＄閹殿偓绱伴崚鍡曢煩

瀵邦喕淇婇幍顐＄閹殿偓绱伴崚鍡曢煩

智能化+大数据赋能 我国安检产业迈进2.0时

多项赛事接踵而来 新技术赋能下安防正与体

智能化+大数据赋能我国安检产业迈进2.0时

多项赛事接踵而来新技术赋能下安防正与体