需要金币:![]() ![]() |
资料包括:完整论文 | ![]() |
![]() |
转换比率:金额 X 10=金币数量, 例100元=1000金币 | 论文字数:9766 | ![]() | |
折扣与优惠:团购最低可5折优惠 - 了解详情 | 论文格式:Word格式(*.doc) | ![]() |
内容摘要:近年来,伴随着互联网技术的迅猛发展,线上招聘的规模不断扩大,企业招聘中的各种信息数据也呈现几何倍数的增长,其中以人才招聘问题最为突出,面对海量的求职者简历,传统的人工筛选不仅时间周期长、效率低,还浪费了有限的人力物力,影响了企业的正常发展和运作。 本文针对线上招聘市场的这一问题,通过比对简历文本和招聘文本的结构,将其文本结构划分为数值文本、简单文本、非结构化文本,并对这三种类型的文本采用不同的匹配算法: 针对数值型文本,先划分属性的取值区间,再对简历信息和招聘信息的属性值进行比较;针对简单文本,依据知识图谱比较叶子节点的图上距离;针对非结构化文本,基于行业特征词词典对文本进行中文分词,并结合停用词词典去停用词,从而得到简历信息序列和招聘信息的分词序列。接着,对分词序列求并集,统计字词并集中字词在各序列的词频,依据词频建立简历信息向量、企业招聘信息向量,求解这两个向量的余弦相似度得到非结构化文本的匹配度。 最终,根据企业对求职者各属性模块的偏好,选取合适的权重,将相似度最高的前几份简历作为推荐简历,为企业定制化地进行人才推荐,以此提高人职匹配的差异度和人才推荐的准确度。
关键词:简历筛选;文本相似度;分词技术; 文本向量化
目录 摘要 Abstract 第1章-绪论-1 1.1 研究背景与意义-1 1.2 国内外研究现状-2 1.3 主要研究内容和章节安排-3 第2章-相关理论与技术概述-5 2.1 分词技术-5 2.2 文本表示-5 2.3 知识图谱-5 第3章-基于文本匹配度的人职匹配算法-6 3.1 问题建模-6 3.2 数值文本处理-8 3.3 简单文本处理-8 3.3.1 工作地点匹配度求解-9 3.3.2 职位匹配度求解-10 3.3.3 学历匹配度和工作性质匹配度求解-11 3.4 非结构化文本处理-12 3.5 定制化的人职匹配公式-13 3.6 实验结果与分析-15 第4章-结束语-19 4.1 本文总结-19 4.2 未来工作展望-19 参 考 文 献-20 致 谢-21 |