【摘 要】本文提出了一种基于改进卷积神经网络的人脸检测算法,对传统卷积神经网络的结构进行了改进,同时利用图像的全局和局部特征来进行人脸检测。仿真实验表明,本文所提出的人脸检测算法取得了良好的检测效果。

【关键词】人脸检测 深度学习 卷积神经网络 局部特征 全局特征

基金项目:西安市科技计划项目,项目名称:公路视频测速中的距离自动标定与测距关键技术研究,项目编号:CXY1701(5)。

文献标识码:A 中图分类号:TP391.4

作为近年来最为流行的机器学习算法,深度学习可以从海量数据中自动学习出表达和区分能力更强的特征,能更准确地表征真实人脸外观。卷积神经网络是深度学习算法的一种,其在图像识别与分析等计算机视觉领域中获得了最为广泛的应用。本文提出了一种基于改进卷积神经网络的人脸检测算法,对传统卷积神经网络的结构进行了改进,并提取图像的全局和局部特征进行人脸检测。

基于改进卷积神经网络的人脸检测

深度学习利用建立好的模拟人脑分析学习机制的神经网络来解释图像、声音和文本等数据,通过对低层特征进行组合形成更抽象的高层特征,从而得到数据的分布式特征。

卷积神经网络是在计算机视觉领域应用最为广泛的深度学习模型,其基本结构包括卷积层和池化层,卷积层利用卷积核提取特征,卷积层通过局部感知和权值共享来减少权值参数数量,池化层利用池化核来对卷积层提取出的特征进行统计操作。

人类识别人脸时在考虑人脸的局部特征的同时,也会考虑人脸的全局特征。为此,本文对传统卷积神经网络的结构进行了改进,改进后的网络结构由3个卷积层、4个池化层、引入层和3个全连接层组成,各网络层的具体参数如表1所示。

表1 改进卷积神经网络结构参数

改进后的卷积神经网络中有3个卷积层,卷积层的具体参数如表1所示,第一个卷积层参数中96×96×3为待处理图像的尺寸,卷积核通过滑窗的方式对输入图进行卷积,每个卷积核对应一种特征提取的方式,卷积操作后得到一个特征图,88×88×32中88×88为卷积操作后特征图尺寸,32为卷积核个数,9×9×3为卷积核尺寸。其他卷积层的参数与此类似。

卷积运算如下式所示:

(1)

其中,[xlj]为卷积神经网络第[l]层的第[j]个神经元,[k]表示卷积核,本文所有卷积核的步长均为1×1,[Mj]为与神经元[xlj]对应的神经网络第[l-1]层核尺寸区域内的神经元集合,[blj]为神经元的偏置,[f]为激活函数,本文采用防过拟合能力强的修正线性单元(ReLU)作为激活函数[1]。

(2)

改进的卷积神经网络共包含4个池化层,为有效提取图像全局和局部特征,本文对前三个池化层和最后一个池化层分别采用最大池化和平均池化方法,最大池化方法适合用于提取图像局部纹理信息,平均池化适合用于提取图像全局信息,最大池化和平均池化方法如(3)和(4)式所示,所有池化核步长本文均设置为1×1。

(3) (4)

其中,[xlj]为卷积神经网络第[l]层的第[j]个神经元,[Mjl-1]为神经元[xlj]对应的神经网络第[l-1]层一个核尺寸区域内的神经元集合。

改进后的卷积神经网络中有3个全连接层,层中神经元与上一层所有神经元相连。全连接层的前面是引入层,引入层没有信息处理能力,只是将对应图像块局部特征的最后一个卷积层和对应图像全局特征的最后一个池化层神经元引入全连接层。全连接层中前两层中的神经元的激活函数采用修正线性单元(ReLU),最后一层神经元的激活函数采用logistic回归函数,输出为人脸检测标签。

(5)

本文改进的卷积神经网络的学习算法采用随机梯度下降算法,目标函数设置为:

(6)

其中,[N]为样本个数,[fi(W)]为卷积神经网络输出,[di]为样本的分类标签,正负样本分别为1和0。

仿真实验及分析

本文分别采用AFLW数据集和FDDB数据集作为训练图像集和测试图像集。AFLW数据集由32203图片中的393703张人脸图片组成,FDDB数据集由2845图片中的5171张人脸图片组成,是学术界评价人脸检测和识别性能时应用非常广泛的测试数据集。

在构造人脸正负样本时,由于不同训练图片中人脸尺寸并不一致,本文将从训练图片中剪切并归一化为96×96像素大小的人脸图片作为正样本,将从训练图像中随机剪切出的同样大小的图像块作为负样本。

表2给出了本文算法和现有部分现有人脸检测算法的检测准确度比较结果。其中,“全局”表示仅利用图片的全局特征时的人脸检测算法;“局部”表示仅利用图片的局部特征时的人脸检测算法;“全局+局部”表示本文所提出的同时利用图片全局和局部特征的人脸检测算法。从表中可以看出,当仅利用图像全局特征时,人脸检测效果很低;当仅利用图像局部特征时,人脸检测效果提升并不明显,而当同时利用图像全局和局部特征时,人脸检测效果得到了进一步的提升。

表2 人脸检测检测准确度比较

图1给出了本文人脸检测算法对FDDB数据集中几幅测试图片的检测结果。从图中可以看出,本文所提人脸检测算法成功检测出了背景和光照条件不同的图片中的人脸,而且人脸的角度也不尽相同。

本文主要研究了如何利用深度学习进行人脸检测,提出了一种基于改进卷积神经网络的人脸检测算法,同时利用图像全局和局部特征来检测人脸。如何进一步改进卷积神经网络结构将是今后的研究内容。

参考文献:

[1]Glorot X,Bordes A,Bengio Y.,“Deep sparse rectifier neural networks”(2011 International Conference on Artificial Intelligence and Statistics, Lauderdale:IEEE Press,2011:315-326).

[2] Jain V Learned-Miller E.,“Online Domain Adaptation of a Pre-Trained Cascade of Classifiers”(2011 IEEE Conference on Computer Vision and Pattern Recognition. Washington:IEEE,2011:577-584).

[3]Yang S,Luo P,Loy C C, et al.,“From facial parts responses to face detection: a deep learning approach”(2015 IEEE International Conference on Computer Vision. Washington:IEEE,2015:3676-3684).