影像资料显示人戴了口罩和帽子,且周围光线黑暗
同样是人机大战,同样是机器战胜人类,为什么AlphaGo取得了震惊世界的效果,而小度却不断被质疑?其中一个很重要的原因就是播出方式不一样,即使具备科学属性,《最强大脑》也不过只是一档综艺节目,经过后期制作,播出的效果远没有直播带来的震撼性和真实性。
而事实到底是怎样的,我们也不得而知,这也不是我们今天讨论的重点(感兴趣的朋友可以上网搜索,网友和百度都给出了相关的说明)。我们今天要说的是,百度自称在人脸识别算法国内第一,有效的依据是什么?以及,在安防领域,人脸识别技术已经达到了何种程度。
LFW和FDDB的排名有意义吗
相信对人脸识别算法有研究的同学对LFW和FDDB也有一定的了解。LFW(Labeled Faces in the Wild)和FDDB(Face Detection Data Set and Benchmark)是全球权威的人脸识别检测平台,做人脸识别算法的公司,多多少少地会到LFW和FDDB上进行检测。
LFW数据库共有5749个人的13233幅图像,其中1680人有两幅及以上的图像,4069人只有一幅图像。FDDB和LFW一样,都是马萨诸塞大学的人脸数据库,它包含2845张图片,共有5171个人脸作为测试集。测试集范围包括:不同姿势、不同分辨率、旋转和遮挡等图片。
百度自称人脸识别算法第一是因为,2015年,百度在LFW中曾达到99.77%的准确率,排名第一。而在2016年,小米和大华分别在FDDB和LFW数据集上拿下了第一的成绩。
LFW和FDDB的权威性不容置疑,但是值得说明的是,由于LFW和FDDB的样本是固定的,相当于一场考试,你已经知道了题目,然后不停改进你的答案,这样的刷分是没有多大意义的。
安防领域的人脸识别有多大能耐
当我们谈到人脸识别时,会出现两个常见和重要的概念,即1:1和1:N。
简单说来,1:1是一对一的人脸“核对”,解决的是“这个人是不是你”的问题,1:N是从众多对象中找出目标人物,解决的是“这个人是谁”的问题。
人脸识别考勤、安检时的身份验证等应用都是1:1概念下的人脸识别应用。
而1:N更多的是用于安防行业,比如在人流密集的场所安装人脸识别防控系统,它和1:1最大的区别就是1:N采集的是动态的数据,并且会因为地点、环境、光线等影响识别的准确性和效果。
一套基本的人脸识别布控系统会具备以下几个功能:
(1)人脸捕获与跟踪功能
人脸捕获是指在一幅图像或视频流的一帧中检测出人像并将人像从背景中分离出来,并自动地将其保存。人像跟踪是指利用人像捕获技术,当指定的人像在摄像头拍摄的范围内移动时自动地对其进行跟踪。
(2)人脸识别计算
人脸识别分核实式和搜索式二种比对计算模式。核实式是对指将捕获得到的人像或是指定的人像与数据库中已登记的某一对像作比对核实确定其是否为同一人。搜索式的比对是指从数据库中已登记的所有人像中搜索查找是否有指定的人像存在。
(3)人脸的建模与检索
可以将登记入库的人像数据进行建模提取人脸的特征,并将其生成人脸模板保存到数据库中。在进行人脸搜索时,将指定的人像进行建模,再将其与数据库中的所有人的模板相比对识别,最终将根据所比对的相似值列出最相似的人员列表。
因此,数据成为提升人脸识别算法性能的关键因素,很多应用更加关注低误报条件下的识别性能,比如支人脸支付需要控制错误接受率在0.00001之内,因此以后的算法改进也将着重于提升低误报下的识别率。对于安防监控而言,可能需要控制在0.00000001之内(比如几十万人的注册库),安防领域的人脸识别技术更具有挑战性。
而随着深度学习演进,基于深度学习的人脸识别将获得突破性的进展。它需要的只是越来越多的数据和样本,数据和样本越多、反复训练的次数越多,它越容易捕捉到准确的结果和给你准确的答案。所以,当一套人脸识别系统的设备,在全面引入深度学习的算法之后,它几乎是很完美的解决了以前长期各种各样的变化问题。
但即便如此,人脸识别技术依然面临实际应用等诸多挑战,如何在各种复杂的场景中得到成功的应用还需要众多的安防厂商共同努力。