近几年,随着计算机领域的快速发展,人们不仅仅满足于使用计算机上网,还把更多的注意力放到了人机交互领域,从而使人机交互领域得到了很大的发展,人脸表情识别技术也随之快速发展起来。人脸表情识别涉及到多个领域,包括人机交互、数字图像处理、模式识别、机器视觉、情感计算等,对其进行深入研究能推动多个领域的发展,而且它对推进计算机的拟人化、智能化具有很大的意义。它还能应用于多个领域,包括娱乐游戏、安全监控、疲劳驾驶、远程教育等。
本文研究的是静态表情识别系统,即识别静态图片中的人脸表情。本文工作的主要目的是构建一个人脸表情识别系统,实现对中性、生气、厌恶、害怕、高兴、伤心、惊讶7种人脸表情的识别。本文首先对本系统进行需求分析,对实现本系统所需要的技术进行梳理,通过对比分析选择适合各个模块的关键技术,最后进行表情识别系统的开发与研究。
人脸表情识别系统主要由以下几个部分组成:图像的预处理、人脸检测、特征分析及提取、分类识别。完成的主要工作如下:
(1) 对采集到的图片进行灰度化、直方图均衡化、降噪等预处理,减小光照、噪声对表情图像的影响,图像的质量能够得到很大的改善。
(2) 人脸检测中,采用Adaboost算法进行人脸检测,运算速度较快,能够很容易地定位人脸。人脸定位后,采用DFM模型对人脸的关键特征点进行定位,并进行对齐处理。
(3) 本系统采用HOG特征或原始像素特征对表情图进行特征提取。HOG特征提取是将图片中像素的梯度方向直方图作为特征向量;原始像素特征提取是将图片中像素的灰度值作为特征向量。实验表明,系统提取HOG特征的识别率高于系统提取原始像素的识别率,但运行速度较慢。
(4) 本系统采用支持向量机SVM对表情图像进行分类识别,训练特征向量得到对应的表情模型文件,利用该模型文件对表情图片进行预测。实验表明,每种表情的样本数均为140时,系统提取HOG特征时,测试库的表情平均识别率为71%,提取原始像素特征时,测试库的表情平均识别率为64%。