本研究探索了利用深度学习和神经网络算法提升面部识别精确度的方法,旨在解决光照、姿态变化等挑战,具有广阔的应用前景。
本段落主要介绍了基于卷积神经网络的人脸识别方法。该方法能够自动提取人脸特征并进行分类。所用的卷积神经网络由两个卷积层、两个池化层、一个全连接层以及一个 softmax 回归层组成。
卷积神经网络是受生物视觉启发的一种多层感知器变形,本质上是一个前向反馈型神经网络。与传统的多层感知器相比,它的特点在于前几层是由卷积和池化交替组成的层次结构,模仿了大脑中用于高层次特征提取的简单细胞和复杂细胞。
在卷积层内,每个神经元仅对输入图像的一部分区域(称为局部感受野)做出响应,并且这些区域会有重叠。这使得网络能够识别出更高阶别的视觉特征;而池化层则通过从前一层选取部分区域求平均或最大值的方法来抵抗轻微的变形或者位移变化,同时减少计算复杂度。
卷积神经网络用于人脸识别时是一种基于学习到的特征来进行工作的方法,区别于传统的人工提取和设计高性能分类器的方式。它能够自动地从未经特殊处理的数据中学习出适合特定识别任务所需的特征,并且这种特性让模型对训练样本的要求降低了很多。
在本段落的研究里,作者借鉴了 LeNet-5 的结构来构建一个六层的卷积神经网络用于 ORL 和 AR 人脸库的人脸识别。该网络采用了四层交替排列的卷积和池化层次用来提取特征,并且使用了一个全连接层以及最后一层非线性分类能力较强的 Softmax 分类器。
在每一轮迭代中,通过局部连接与权值共享的方式模拟大脑中的简单细胞来获取初级视觉特性;而池化操作则进一步将这些初级的视觉特征筛选并组合成更高级、抽象的形式。本段落特别提到了采用最大值采样作为其池化策略,即以2*2大小的矩形为单位进行处理。
全连接层被加入到网络中是为了增强模型非线性表现的同时控制规模;而 softmax 回归层则用于输出分类结果的概率分布情况。
实验结果显示,该方法在 ORL 和 AR 人脸库上的识别率分别达到了99.50%和99.62%,超越了传统的特征提取与分类器设计。由此可以看出本段落提出的方法具有广泛的应用前景,并且非常适合于人脸识别领域。