人脸识别硬核科普:人群中看你一眼,从此不忘你容颜

  • 时间:
  • 浏览:0

小编是个天生懒惰的人,一并又是个急性子,那我的人最享受被科技服务的乐趣。

举个例子,十多年前许多人儿还在普遍用现金的时代,小编在商店买东西排队结账,每当看了收银员找零时手忙脚乱的样子就会心急如焚,只恨只能拿了东西直接走人。那时候 年幼的小编就攥紧拳头梦想着时候 一定要创造发名一种不必找零钱的最好的土措施。

就我应该 是什么在心底萌芽多年的梦想被别人实现了,失望之余小编也乐享其成。用手机扫扫码就能付钱可比现金方便快捷多了。可天知道小编“懒癌+急癌”晚期,久而久之竟其实抬手扫码、输入密码那我的动作也很麻烦。所时候 来出显的指纹支付否是拯救了小编。

再时候,连手指时会用动了,意味出显了“刷脸支付”,配合手上苹果机5手机的卓越体验,不得不说小编爱死了你是什么 功能。

嗯,刷脸支付将小编从付钱时漫长等候的焦躁和不安中解救了出来,不必 在IT之家编辑部的科技氛围里淫浸多年后,小编其实有必要为许多人儿讲一讲“刷脸”到底是个有哪些东西,也还都可不后能 有知恩图报了!

“刷脸”,顾名思义,眼前 是一项关键技术:人脸识别。

别看这两年意味在智能手机上的使用而大热,其实人脸识别技术最早的研究都可不后能 追溯到20世纪200年代,当时意味有科学家在研究人脸轮廓的提取最好的土措施,但受限于技术水平,这项技术的相关研究一度停滞,直到20世纪200年代,人脸识别的最好的土措施才有了新的突破,神经生理学、脑神经学、视觉等相关知识被引入,人脸识别进入了新的发展阶段。

不必 ,当前阶段的人脸识别时会单一的技术,不必 融合了神经生理学、脑神经学、计算机视觉等多方面学科的技术。不过,本质上它还是一项计算机视觉技术。

当然,IT之家做这篇文章的重点不在 于回顾人脸识别的历史,不必 和许多人儿讲讲人脸识别眼前 的许多基本原理。

人脸识别技术系统的基本逻辑架构

许多人儿每天用人脸识别技术解锁手机、结账付款,是只能的自然,但相信很少有同学深入思考这项技术眼前 是怎么可不后能 另另两个 流程。

前面许多人儿说,计算机视觉是人脸识别关系最紧密的技术。不必 许多人儿从你是什么 点入手。

计算机视觉,通俗来说不必 利用摄像头等设备代替人眼,来获取图像,利用计算机对图像信息进行补救,综合人类的认知模式来建立人类视觉的计算理论。

这其中,最难的无疑是怎么可不后能 补救图像信息、怎么可不后能 模拟人类的认知模式。

为了补救有有哪些现象图片,计算机视觉还引入了图像补救、模式识别、图像理解、图像生成等学科的知识。

图像补救不必 把原始图像转添加计算机更容易识别的图像;模式识别,不必 计算机判断当事人要识别的是有哪些和为什么我么我么识别的过程;图像理解,不必 对图像中描述的景物进行分析;图像生成,举例来说不必 当图像的次责信息缺失时,都都可不后能 将缺失的信息补上……

有有哪些时会计算机视觉都可不后能 借助的学科技术。这上方许多人儿要着重讲的是模式识别,它是另另两个 独立的理论体系,具体到计算机视觉领域的应用,它表示将计算机表示出来的图像和一致的类别进行匹配的过程。

怪怪的难懂是吧。IT之家为许多人儿通俗解释一下,所谓“识别”,不必 先认识,否则辨别。认识有哪些?认识的是图像和从图像中总结的目标物体的形状。为什么我么我么辨别?不必 将总结出来的形状和当事人意味掌握的形状库进行比对,否则都可不后能 实现辨别。

许多人儿人类识别一样物体也是遵循你是什么 逻辑,先总结形状,否则比对。至于前面的“模式”,时会点抽象了,我应该 理解为一种规律,它影响着形状和类型比对的结果。

没错,人脸识别本质上也是你是什么 过程。

不必 ,许多人儿沿着模式识别的思路,来看看它的整体过程:分别为预补救、形状提取和分类等。许多人儿画出如下流程图:

预补救是第一步,否则这次责工作意味不必 很杂,类似于于减少图像中的噪声干扰、提高清晰度、还有包括图像滤波、变换、转码、模数转化等。

形状提取,不必 在预补救后的图像中,提取对识别有明显作用的形状,并在你是什么 过程中降低模式形状的维数,令其便于补救。这是另另两个 复杂性的过程,上方许多人儿讲到具体最好的土措施时候 会有体现;

分类,不必 对提取到的形状值按照一定的准则进行分类,便于决策。

举个例子,计算机要识别出这张照片中的女孩子,当它拿到照片时,意味其实画面太暗,先提个亮度,否则又发现噪点不必 ,再做个降噪……一顿操作后感觉还都可不后能 了,再将照片转化为数字信息,你是什么 过程是预补救。

提取出来的形状值会进入单独的形状空间,意味那我还都可不后能 更好地识别和做分类。接下来,就要对形状空间里的数据进行分类了,让它们眼睛归眼睛,鼻子归鼻子,头发归头发……基于有有哪些分类好的数据,计算机才还都可不后能 进行识别判断和决策。

当然,为了方便许多人儿理解你是什么 逻辑过程,IT之家在这里不必 举例粗略地说明,意味不准确,实际的步骤也是相当复杂性的,都可不后能 考虑各种干扰的因素,类似于于图像的质量不清晰、背景复杂性、图像光照分布不均匀、目标姿势高度出显扭曲意味佩戴了头饰、眼镜以及长了胡须、化了妆等等各种状况。

还有要说明的许多是,你是什么 模式识别的系统是都可不后能 另另两个 自我训练、学习的过程的,其中最重要的是对前面分类错误率的训练(分类器训练),意味在前面的分类中,许多人儿无法保证分类的结果是200%正确的,但都可不后能 控制在一定的错误率类似于于,这都可不后能 通过絮状的训练样那我不断修正,令错误率符合要求。

好了,基于以上对计算机视觉模式识别的讨论,许多人儿就还都可不后能 给出人脸识别系统的主要功能模块了:

意味有小伙伴其实上方你是什么 举出功能模块太简单了,不必 许多人儿再精确许多,给出下面的逻辑架构图,相信不难 理解:

人脸识别的主流最好的土措施

在上方一次责,许多人儿主要介绍了人脸识别的基本逻辑流程,其实人脸识别的基本思想是比较类似于于的,时会要将图像中的形状提取出来,转换到另另两个 离米 的子空间里,否则在你是什么 子空间里衡量类似于于性或分学得习。但现象图片在于,对客观世界采用怎么可不后能 协调统一且有成效的表示法?许多人儿要找到怎么可不后能 离米 的子空间,怎么可不后能 去分类,都可不后能 区分不类似于于,聚集类似于于的类别?为补救有有哪些现象图片,衍生出了不必 种最好的土措施和补救方案。

不必 说,许多人儿所说的人脸识别技术是笼统的,事实上,这是另另两个 不必 技术和最好的土措施的集合。

许多人儿不妨最好的土措施上方的逻辑形状图来逐步说明。

1、预补救

人脸图像的预补救,你是什么 步只能不必 可说的,主要包括消除噪声、灰度归一化、几何校正等,有有哪些操作一般有现成的算法还都可不后能 实现,属于比较基本的操作。不过要说明的是,这里主要说的是静态人脸图像的预补救,意味是动态人脸图像的预补救,就复杂性性了,一般是要先将动态人脸图像分割成一组静态人脸图像,否则对人脸进行边缘检测和定位,在做一系列的补救,这里就不展开了。

2、形状提取

图像形状的提取是比较关键的一步(上文所说的模式空间向形状空间的跨越),但对于图像补救来说也是比较初级的一步。目前关于图像形状提取的最好的土措施有不必 ,但其实许多人儿想一想,通常而言图像的形状还是还都可不后能 归类的,类似于于颜色形状、纹理形状、空间关系形状、形状形状等,每一种形状时会匹配的最好的土措施,其中含许多比较经典、好用的最好的土措施,类似于于HOG形状法,LBP形状法,Haar形状法等,小编当然不意味一一讲解,不必 这里选取其中一种——HOG形状法。

HOG形状也叫方向梯度直方图,它是由Navneet Dalal和Bill Triggs在2005年的一篇博士论文中提出的。许多人儿简单来看它是为什么我么我么进行的。

许多人儿以这张照片为例,第一步是要将它变成黑白的照片,意味色彩信息在这里对识别并只能帮助。

在这张黑白照片中,许多人儿从单个像素看起,观察它符近的像素,看它是往哪个方向逐渐变暗的,否则用箭头表示你是什么 像素变暗的方向。

意味对每个像素执行那我的操作,那我所有像素时会被那我的箭头取代,它们表示了像素明暗变化的方向。每另另两个 那我的箭头表示明暗梯度。

事实上,对于每另另两个 像素,给定坐标系,许多人儿都都可不后能 求出它的梯度方向值。计算的最好的土措施复杂性性,许多人儿不都可不后能 了解,只都可不后能 知道你是什么 步是为了捕获目标的轮廓信息,一并进一步弱化光照的干扰。

意味是以那我的最好的土措施做提取的话,计算量会很大。不必 许多人儿会把图像分割成8x8像素的小方块,叫做另另两个 Cell,否则对每个Cell计算梯度信息,包括梯度的大小和方向。得到的是你是什么 Cell的9维形状向量。

相信到这里许多人儿许多不懂了。IT之家再为小伙伴们稍微解释一下,其实你是什么 步的目的是为每个Cell构建梯度方向直方图,直方图不必 许多人儿许多人儿熟知的条形统计图,你是什么 直方图中,X轴是将方向划分的区间,Navneet Dalal等人研究表示划分9个区间效果是最好的,意味是1200°的方向,每个区间就代表20°。y轴表示某个方向区间内的梯度大小。那我应该 等于是每个Cell的形状描述符。

▲大致不必 你是什么 意思(图片来源:加州大学旧金山分校图像补救论文)

这里还有一步,不必 意味你的图像受到光照的影响比较大,只能还还都可不后能 将一定的Cell组成另另两个 block,类似于于2x另另两个 Cell,那我每个block上不必 36维的形状向量,否则对这36维形状向量做规范化(具体怎么可不后能 规范,涉及到高等数学的知识,许多人儿不必 都可不后能 知道)。

意味许多人儿输入的图像大小是256x512像素,只能时会32x64=2048个Cell,有31x63=195两个 block,每个block有36维向量,只能你是什么 图像时会1953x36=702008维向量。这702008维向量不必 你是什么 图像的HOG形状向量了。

当然,上方有有哪些步骤你也可时会了解,你只都可不后能 知道,最后原始的图像被表示成了HOG的形式,如下图:

否则根据你是什么 HOG形式,在许多人儿的库中找到与已知的许多HOG样式中,看起来最类似于于的次责。

3、图像识别

人脸识别技术经过科学家多年的研究和发展,意味形成了多种研究方向和更多种的研究最好的土措施,意味许多人儿梳理一下,主要包括基于几何形状的最好的土措施、基于模板的最好的土措施、基于模型的最好的土措施以及许多最好的土措施。

基于几何形状的最好的土措施是比较早期、传统的最好的土措施了,它主不必 研究人脸眼睛、鼻子等器官的形状和形状关系的几何描述,以此作为人脸识别的重要形状。

基于模板的最好的土措施基本思想是拿已有的模板和图像中同样大小的区域去比对,包括基于相关匹配的最好的土措施、形状脸最好的土措施、线性判别分析最好的土措施、神经网络最好的土措施等。

基于模型的最好的土措施的方向是对人脸的显著形状进行形状点定位,否则进行人脸的编码,再利用相应的模型进行补救实现人脸识别,类似于于隐马尔柯夫模型,主动形状模型和主动外观模型的最好的土措施等。

▲不同的人脸识别算法

在人脸识别领域,有许多比较经典的算法,类似于于形状脸法(Eigenface)、局部二值模式法、Fisherface等,不过IT之家在这里还是还是其实与时俱进比较好,不必 选取另另两个 目前应用比较广泛且流行的最好的土措施作为示例,叫做OpenFace。当然,许多人儿不做实际的测试,不必 通过它来了解识别的原理。

OpenFace属于基于模型的最好的土措施,它是另另两个 开源库,中含了landmark,head pose,Actionunions,eye gaze等功能,以及训练和检测所有源码的开源人脸框架。

在前面的步骤中,IT之家意味为许多人儿介绍怎么可不后能 通过HOG的最好的土措施将图像中人脸的形状数据提取出来,也不要 成功检测到了人脸。

这时又有另另两个 现象图片,不必 你是什么 人脸的姿势好像时会只能“正”,同样另另两当事人,意味她的姿势,面部的朝向不同,人类仍然能认出她来,而计算机意味就认不在 了。

补救你是什么 现象图片,有另另两个 最好的土措施,不必 检测人脸主要形状的形状点,否则根据有有哪些形状点对人脸做对齐校准。这是Vahid Kazemi和Josephine Sullivan在2014年创造发名的最好的土措施,许多人给人脸的重要次责选取68个形状点(Landmarks),这68个点的位置是固定的,不必 只都可不后能 对系统进行许多训练,就能在任何脸部找到这68个点。

图片来源:OpenFace API阅读文档(点此前往)

有了这68个点,就还都可不后能 对人脸进行校正了,主不必 通过仿射变换将那我比较歪的脸摆正,尽量消除误差。这里的仿射变换主要还是进行许多旋转、放大缩小或轻微的变形,而时会夸张的扭曲,那样就只能看了。

▲过程离米 是那我,那我的脸被进行了一定程度的校正(图片来源:OpenFace github说明页面)

那我许多人儿把原始的人脸图像以及HOG的形状向量输入,都都可不后能 得到一张姿势正确的只中含人脸的图像。

注意,到你是什么 步许多人儿还只能直接拿这张人脸图像去进行比对,意味工作量不必 ,许多人儿要做的是继续提取形状。

接着,许多人儿将你是什么 人脸图像再输入另另两个 神经网络系统,让它为你是什么 脸部生成128维的向量,也还都可不后能 说是你是什么 人脸的128个测量值,它们还都可不后能 表示眼睛之间的距离,眼睛和眉毛的距离、耳朵的大小等等。这里不必 方便许多人儿理解而举例,实际上具体这128维的向量表示了有哪些形状,许多人儿不得而知。

当然,你是什么 步说起来简单,其实难点在于怎么可不后能 训练那我的另另两个 卷积神经网络。具体的训练最好的土措施时会许多人儿都可不后能 了解的,但许多人儿还都可不后能 了解一下训练的思路。训练时许多人儿还都可不后能 输入另另两当事人脸图像的向量表示、同一人脸不同姿态的向量表示和另一人脸的向量表示,反复进行类似于于的操作,不必 断调整,调整的目标是让同一类对应的向量表示尽意味接近,其实也不要 同另另两当事人的向量表示尽意味距离较近,同理,不类似于于别的向量表示距离尽意味远。至于人工智能神经网络训练的基本原理,许多人儿还都可不后能 查看IT之家时候 发布的《AI时会科幻电影里的洪水猛兽,不必 被慢慢变革的生活最好的土措施》这篇文章。

其实训练的思路也很好理解,意味另另两当事人的人脸不管姿态为什么我么我么变,在一段时间内许多东西是固定的,比如眼睛间的距离、耳朵的大小、鼻子的长度等。

在得到这128个测量值后,最后一步就简单了,不必 将这128个测量值和许多人儿训练、测试过的所有面部数据做比对,测量值最接近的,不必 许多人儿要识别的那当事人了。

那我应该 还都可不后能 完成一次人脸的识别。

总结

人脸识别技术经过70多年的发展,到今天意味发展成为一门以计算机视觉数字信息补救为中心,糅合信息安全学、语言学、神经学、物理学、AI等多学科交合的综合性技术学科,内涵已极为充足,否则发展快速。而IT之家在本文试图为许多人儿讲解的,不必 人脸识别最基础和通俗的原理以及相对单一的用例分析,显然无法中含人脸识别领域所有的内容,不必 希望借此对许多人儿理解、认识如今许多人儿意味习惯使用的人脸识别功能有所帮助。

国际调研机构Gen Market Insights发布的数据显示,到2025年底全球人脸识别设备市场价值将达到71.7亿美元,智能手机上对人脸识别技术的广泛应用,不必 为许多人儿了解这项技术提供了另另两个 契机,未来,随着5G万物互联时代的到来,智能硬件市场将得到极大扩展,那才是人脸识别技术真正大展身手的天地。

嗯,不错,期待你是什么 时代早日到来,到时候 小编这张盛世美颜终于能做点有意义的事情了,也算不负父母恩泽。

本文参考资料:

沈理、刘翼光,熊志勇,2015-11-16,《人脸识别原理及算法:动态人脸识别系统研究》

CSU985,CSDN,2018-10-06,《图像形状提取总结》

人工智障v,简书,2018-07-200,《HOG形状——行人识别》

laolaonuonuo,CSDN,2018-03-10,《人脸识别主要算法》

大数据v,CSDN,2018-08-23,《高度干货!一文读懂人脸识别技术(建议收藏)》

leon1741,CSDN,2018-08-02,《深入浅出人脸识别原理》

zouxy09,CSDN,2015-04-25,《人脸识别之形状脸最好的土措施(Eigenface)》

csdn研发技术,CSDN,2018-01-26,《看OpenFace怎么可不后能 做到精准人脸识别》