记得在前面一篇文章中,我们讲到了美颜sdk中,关于图像预处理的文章。在这一环节结束后,就到了核心环节:人脸识别。人脸识别就是在输入的图像中用矩形框标记人脸位置的过程,它属于目标检测的范畴。而在这个环节,需要首先进行图像特征提取。
一、什么叫做图像特征提取
所谓的图像特征就如同一个人有高、矮、胖、瘦等特征一样,图像具有纹理、色彩、形状、空间等特征。一张图像包含的信息太多了,对于美颜sdk而言,需要建立一个能够代表这幅图像用于相关特征的数学描述,因此就有了提取图像特征的概念。
二、在人脸识别中,主要应用哪些图像特征
1、HOG特征
方向梯度直方图,特征是一种在计算机是觉得和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图特征。其实现方法如下:
首先将图像分成小的联通区域,称之为细胞单元,然后采集细胞单元中各像素点的梯度或边缘方向的直方图。最后把这些直方图组合起来就可以构成HOG特征描述器。
具体实现过程如下:
1、图像归一化处理。为了减少光照因素的影响,需要将整个图像进行归一化处理。选取的是Gamma压缩算法,因为光照对图像局部的表层影响最大,对输入的灰度图像进行Gamma压缩。Gamma的大小小于1。
2、计算图像梯度。计算图像横坐标和纵坐标方向的梯度,并据此计算每个像素位置的梯度方向值。首先用[-1,0,1]梯度算子对图像做卷积运算,得到x方向的梯度分量gradx,然后用[1,0,-1]梯度算子对图像做卷积运算,得到y方向的梯度分量grady。然后根据公式T(x,y)=arctan(grady/gradx)计算改像素点的梯度大小和方向。
3、将图像分割成cell,每个cell构建梯度方向的直方图。将图像分成若干个cell,例如分割后的每个cell为6x6个像素,采用9个bin的直方图来统计这6x6个像素的梯度信息。统计方法是对cell内每个像素的梯度方向在直方图中进行加权投影,就可以得到这个cell梯度方向的直方图了,这也构成了每个cell对应的9维特征向量。图像分割了N个Cell,那么就建立了图像的HOG特征描述。
以上就是在美颜sdk的人脸识别中,所用到的其中一个图像特征技术,关于剩余的技术,小编会放到下篇文章中继续介绍,如果您对美颜sdk开发感兴趣,欢迎咨询官方客服。
声明:本文由美狐原创,未经允许禁止转载,谢谢合作。