随着时代的发展,现代办公环境对自动化、无纸化的去人工管理方法需求越来越大。某些大型公司都纷纷建立起了自己的招聘系统,求职者通过在其系统上提交自己的电子简历来争取面试的机会。随着公司规模的扩大和求职者数量的增多,电子简历的管理和筛选分类逐渐成为需要消耗大量人力所完成的工作。为了增强简历管理和筛选分类工作的自动化强度,本文设计并实现了基于文本分类算法的校园招聘管理系统,并在某大型公司的招聘中得到了应用。
本文主要工作有:
1. 研究了IG特征选择算法,并对其进行了改进。通过在IG特征选择算法评估函数中引入了频度和分散度,改进了IG特征选择算法,弥补了原有IG算法偏好低频词的缺点,通过实验证明此改进方式提高了IG特征选择算法的性能。研究了CHI特征选择算法以及针对CHI算法的改进策略,通过实验对改进的CHI算法进行了性能验证,并进对改进的IG特征选择算法和改进的CHI特征选择算法性能对比分析。
2. 研究实现了C4.5决策树算法和SVM分类算法。对C4.5决策树算法信息增益率属性选择与悲观剪枝分析,并在Weka软件上进行了算法实现,得到了C4.5决策树算法分类结果;对SVM分类算法原理进行了研究,对SVM核函数和惩罚参数进行了分析,通过实验对SVM分类算法的核函数、惩罚参数进行了寻优,最终确定了针对简历文本分类的SVM最优核函数、最优惩罚参数。
3. 设计了基于改进文本分类的校园招聘管理系统。设计了系统的总体功能、开发体系结构和开发框架;重点设计了结合改进文本分类算法的3个创新模块,即:学生简历管理模块、简历匹配模块和评星管理模块。
4. 实现了学生简历管理、简历匹配和评星管理3个主要模块:系统学生简历Excel导出功能、优化SVM分类器预测结果Excel导入功能、预测结果匹配功能以及C4.5决策树结果定义评星标准的功能。运行改进的校园招聘管理系统各个模块后表明系统中的各模块运行稳定、操作简单、通过结合优化SVM分类器预测,增强了系统的功能性和指导性。