中文题名: | 自然环境下的鸟类叫声识别的研究 |
姓名: | |
学号: | 1049721303157 |
保密级别: | 公开 |
论文语种: | chi |
学科代码: | 081001 |
学科名称: | 通信与信息系统 |
学生类型: | 硕士 |
学位: | 工程硕士 |
学校: | 武汉理工大学 |
院系: | |
专业: | |
研究方向: | 机器学习 软件 |
第一导师姓名: | |
第一导师院系: | |
完成日期: | 2015-04-10 |
答辩日期: | 2015-05-17 |
中文关键词: | |
中文摘要: |
鸟类研究对生物学有着不可替代的作用。作为生态系统中的重要的成员,鸟类的种类和数量能预示着环境气候等各种地理学和生态学问题。而统计鸟类的叫声能够有效地预知鸟类的数量和种类,所以研究鸟类的叫声的意义十分重要。传统的鸟类数据采集的办法是人工靠看或者听来收集并统计信息,计算机科学日益强大的今天,机器学习逐渐被应用到了鸟类识别的工作中。 鸟声识别的研究中比较流行的特征参数有频谱图的频谱分段、时频图的纹理特征和美尔倒谱系数(Mel—frequency cepstrum co—efficients,MFCC)等。本文所有的数据集是在自然环境下采集的,它们的噪声严重,并且同一个音频样本中有可能存在多种鸟类的叫声,所以本质上是属于多标记学习问题。多标记问题的特点是每一个样本中存在多个种类的标签,而频谱图中的每个频谱分段只会有一种标签,所以本文使用的特征参数是来自频谱图的频谱分段,这样方便将多标记问题化简为单标记问题。本文的具体工作如下: (1)对数据集样本进行预处理并提取特征。首先,音频文件在重叠帧处理后,利用汉明窗进行傅里叶变换,得到频谱图。然后对频谱图进行对数处理,得到每个样本对应的对数谱。用到高斯平滑滤波、梯度计算、二值化等方法对每个对数谱进行了图像的处理,这个过程完成了去噪和特征加强的工作,并得到了一个频谱分段轮廓清晰的图像。最后,提取频谱分段的边缘信息作为样本特征。 (2)将K-means聚类算法和随机森林算法结合,完成了对鸟类叫声的识别。首先对特征信息进行聚类操作,将相似的频谱分段特征聚集在一起形成字典(codebook)。然后把字典中训练集的部分提出来,并建立随机森林的模型。最后将字典中测试集的部分放到模型中测试,得到预测的结果。 (3)将模板匹配算法和随机森林算法结合,完成了对鸟类叫声的识别。这里的模板匹配和K-means聚类算法有着相似的作用。让预处理部分得到的频谱分段的边缘特征信息作为模板匹配的模板,首先将这些模板在所有的样本频谱中进行匹配。训练集匹配后得到一个已经分类的字典,利用它建立随机森林的模型。然后将测试集部分匹配的结果作为模型输入,并得到相应的预测结果。 (4)将使用的两种方法在运行时间和精确度两方面进行了比对和分析。精确度方面使用AUC的值来进行比较,而运行时间则是计算机处理不同方法所用的时间。通过实验的结果可知,模板匹配结合随机森林的方法比聚类结合随机森林的方法要有更高的精确度。但是在运行时间方面,模板匹配用了更多的时间,而K均值聚类算法的运行时间是很快的。 |
参考文献: |
[1] 卢世军. 生物特征识别技术发展与应用综述[J]. 计算机安全, 2013, (1):63-67. [2] 黄英来. 基于动物声音的个体辨认技术的研究[D]. 东北林业大学, 2006. [3] 何清, 李宁, 罗文娟,等. 大数据下的机器学习算法综述[J]. 模式识别与人工智能, 2013. DOI:doi:10.3969/j.issn.1003-6059.2014.04.007. [4] 张倩, 刘怀亮. 一种基于半监督学习的短文本分类方法[J]. 现代图书情报技术, 2013, (2). [5] 雷富民. 鸟类鸣声结构地理变异及其分类学意义[J]. Zoological Systematics,1999,24(2):232-240. [6] 蒋翠清, 邵宏波. 基于MFCC与改进ACF的汽车声音识别算法研究[J]. 计算机技术与发展, 2015, (2). [11] 戴天虹, 李野, 孙鹏. 基于MATLAB鸟叫声特征提取方法的研究[J]. 森林工程, 2013, 29(2):130-134.. [16] 李宇峰, 黄圣君, 周志华. 一种基于正则化的半监督多标记学习方法[J]. 计算机研究与发展, 2012, 49(6):1272-1278. [26] 刘熙沐, 王二庆, 曹亮. 基于DSP实现的改进型短时对数谱语音增强算法研究[J]. 电子技术与软件工程, 2014, (11):58-58. [27] 段瑞玲, 李庆祥, 李玉和. 图像边缘检测方法研究综述[J]. 光学技术, 2004, 31. DOI:doi:10.3321/j.issn:1002-1582.2005.03.028. [35] Breiman L. Random Forests[J]. Machine Learning, 2001, 45(1):5--32. |
中图分类号: | TN912.34 |
馆藏号: | TN912.34/3157/2015 |
备注: | 403-西院分馆博硕论文库;203-余家头分馆博硕论文库 |