芯翌联合清华发布全球最大公开人脸数据集算法斩获全球第一-企业新闻-中国安全防范产品行业协会

芯翌联合清华发布全球最大公开人脸数据集算法斩获全球第一

2021/3/25 10:24 前瞻网 关键字：芯翌,清华,人脸数据集 ,算法浏览量：

芯翌科技与清华大学自动化系智能视觉实验室合作，推出了全球最大的公开人脸数据集WebFace260M。该研究论文已被CVPR2021收录。以该数据集为基础，芯翌科技在最新的全球人脸识别算法测试（NIST-FRVT）榜单中斩获戴口罩人脸识别评测赛道的第一名。

　　日前，芯翌科技与清华大学自动化系智能视觉实验室合作，推出了全球最大的公开人脸数据集WebFace260M。该研究论文已被CVPR2021收录。以该数据集为基础，芯翌科技在最新的全球人脸识别算法测试（NIST-FRVT）榜单中斩获戴口罩人脸识别评测赛道的第一名。

　　数据集为学术界贡献了一个新的百万级人脸基准，包含有噪声的4百万人脸数目/2.6张图片(WebFace260M)和清洗后的2百万人脸数目/420万张图脸(WebFace42M)训练数据，以及精心设计的时间约束评估协议。

　　研究团队从互联网上收集了共计4百万的姓名列表，并下载了2.6亿张人脸图片。然后设计了一个自动利用自我训练（CAST）流水线来对庞大的数据库进行清洗。数据库拥有高效且可扩展的特性。

　　据悉，净化后的WebFace42M是最大的公共人脸识别训练集。出于期望缩小学术界和产业之间的数据差距的目的，团队参照实际场景，构建了InferenceTimeconStraint（FRUITS）协议和测试集来全面评估人脸识别数据库。

　　利用FRUIT协议，团队开发了一个分布式框架来有效地训练人脸识别模型，而不影响其性能。在WebFace42M的支持下，我们在具有挑战性的IJB-C集上降低了40%的失败率，在NIST-FRVT1:1人脸识别评测中的430个条目中排名世界第三。即使是10%的数据(WebFace4M)也表现出比公共训练集更优越的性能。此外，在FRUITS-100ms/500ms/1000ms协议下的富属性测试集上建立了全面的基线，包括MobileNet、EfficientNet、AttentionNet、ResNet、SENet、ResNeXt和RegNet系列。

　　NIST-FRVT是全球顶尖科研机构角逐的赛场，测试数据不公开。该测试通过不同类型的照片样本进行上百亿次对比，对人脸识别算法的评估可达到百万分之一精度，是当今全球规模最大、标准最严、竞争最激烈、最权威的人脸识别算法竞赛，素有工业界黄金标准之称。能在NIST-FRVT中斩获首席，可想而知算法的准确率高得吓人。

微信扫描二维码，关注公众号。

共建平安智能体打造治理新格局相约华为20

金融领域安防技术的智能化应用与发展

共建平安智能体 打造治理新格局 相约华为20

金融领域安防技术的智能化应用与发展

共建平安智能体打造治理新格局相约华为20