技术动态 > 正文
百度飞桨6项视觉能力更新 涉及15种算法和35个预训练模型
2020/3/25 11:40:00   中国安防行业网      关键字:百度飞桨 视觉 算法      浏览量:
PaddleCV依托于飞桨底层核心技术以及百度大脑软硬一体AI大生产平台的优势,贯通了从核心技术、生态应用,再到商业化解决方案的整套体系,支撑百度视觉成为目前业内规模最大、技术栈最全面、生态体系最完善的视觉技术平台,形成可自我持续迭代优化的闭环。
  从百度飞桨获悉,近日,国内唯一开源开放的深度学习开源平台——百度飞桨,在智能视觉领域实现重大升级。PaddleDetection、PaddleSeg、PaddleSlim和PaddleLite实现升级;全新发布3D视觉和PLSC超大规模分类2项能力。同时,PaddleCV新增了15个在产业实践中广泛应用的算法,整体高质量算法数量达到73个;35个高精度预训练模型,总数达到203个。

  其中PaddleDetection模块种类与性能全面提升,YOLOv3大幅增强,精度提升4.3%,训练提速40%,推理提速21%;人脸检测模型BlazeFace新增NAS版本,体积压缩3倍,推理速度提速122%;新增IoU损失函数类型,精度再提升1%,不增加预测耗时。在模型方面,新增3个类型,基于COCO数据集的精度最高开源模型CBNet,高达53.3%;Libra-RCNN模型精度提升2%;OpenImagesV5成为目标检测比赛最佳单模型。
  PaddleSeg新增基于HRNet的高精度图像分割模型,其最大的特点是将图像在整个处理过程中保持高分辨率特征,这和大多数模型所使用的从高分辨率到低分辨率网络产生的低分辨率特征中恢复高分辨率特征有所不同。同时,获得实时语义分割模型Fast-SCNN,它的最大特点是“小快灵”,即该模型在推理计算时仅需要较小的FLOPs,就可以快速推理出一个不错的结果。
  PaddleCV还新增了3D点云分类、分割和检测的PointNet++和PointRCNN模型。PointNet++在ModelNet40数据集上,分类精度高达90%;PointRCNN在KITTI(Car)的Easy数据子集上,检测精度高达86.66%。和此前PaddleCV支持的数十种模型一样,基于飞桨框架,开发者无需全新开发代码,只要进行少量修改,就能快速在工业领域实现3D图像的分类、语义分割和目标检测任务。
  图像分类新增预训练模型SENet-vd、Res2Net、HRNet系列模型。Res2Net可以更细粒度表示多尺度特征,HRNet全程都可以保持高分辨率。截至目前,飞桨图像分类模型包含了ResNet、ResNet-vd、ResNet_ACNet、MobileNet、ShuffleNet、EfficientNet等系列近20类图像分类算法,105个预训练模型,也可供目标检测、图像分割等任务应用。其中,ResNet-vd系列相比ResNet系列模型,在不增加推理耗时的情况下,精度提高1%-2%,EfficientNet推出了small版本,在GPU上速度提升1.59倍。
  PaddleCV依托于飞桨底层核心技术以及百度大脑软硬一体AI大生产平台的优势,贯通了从核心技术、生态应用,再到商业化解决方案的整套体系,支撑百度视觉成为目前业内规模最大、技术栈最全面、生态体系最完善的视觉技术平台,形成可自我持续迭代优化的闭环。
  此次PaddleCV的重磅升级,飞桨为视觉领域提供了更为强大且应用广泛的工具,加速不同产业的AI落地。除了在视觉领域,飞桨也形成了语音、视觉、NLP等全方位的能力体系。飞桨还充分发挥全硬件平台能力的优势,与昆仑芯片深度融合优化,打造技术领先、自主可控的软硬一体技术平台。
  目前,飞桨已累计服务150多万开发者,帮助6.5万企业用户。