收藏 分享(赏)

基于粗糙集的人力资源评价的规则挖掘.doc

上传人:kuailexingkong 文档编号:1263638 上传时间:2018-06-21 格式:DOC 页数:13 大小:88.50KB
下载 相关 举报
基于粗糙集的人力资源评价的规则挖掘.doc_第1页
第1页 / 共13页
基于粗糙集的人力资源评价的规则挖掘.doc_第2页
第2页 / 共13页
基于粗糙集的人力资源评价的规则挖掘.doc_第3页
第3页 / 共13页
基于粗糙集的人力资源评价的规则挖掘.doc_第4页
第4页 / 共13页
基于粗糙集的人力资源评价的规则挖掘.doc_第5页
第5页 / 共13页
点击查看更多>>
资源描述

1、基于粗糙集的人力资源评价的规则挖掘来源:bet365 http:/摘 要 应用粗糙集理论和区分矩阵来挖掘各因素规则的方法对一个人力资源评价的例子进行分析和处理,挖掘评价规则,并从客观的数据中得出了各主要因素的客观权重。关键词 粗糙集; 人力资源; 规则; 权重 1 前言粗糙集(Rough sets)理论是一种处理模糊、不精确的分类问题的新型数学工具。粗糙集理论已成为当前数据挖掘的主要方法之一,其主要思想是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。该理论已被成功地应用于机器学习、决策分析、过程控制、模式识别与数据挖掘领域。 人力资源是指社会所拥有的能为社会创造价值的人力

2、或劳动力,其本质是人的能力而不是人本身,人力资源的价值在于人掌握的知识和技能,在于人为社会创造价值的能力。人力资源评价就是通过分析影响人力资源价值的主要因素,结合一定的评价方法,进而得出一个综合评价值的过程。 2 粗糙集处理的基本步骤及算法 收集和整理数据,组成信息表。 数据预处理。将数据库中的初始数据信息进行分类、聚类分析以及使某些属性的连续值离散化,转换为粗糙集形式,明确条件属性和决策属性。 属性约简,根据预处理后的数据信息表生成区分矩阵,利用区分矩阵法生成约简属性集。 区分矩阵(Discernibility Matrix)是由波兰华沙大学的著名数学家skowron提出来的,是近年来在粗糙

3、集约简上出现的一个有力工具。利用这个工具,可以将存在于复杂的信息系统中的全部不可区分关系表达出来。定义1:设有信息系统 S,a( x)是记录 x在属性 a上的值cij表示区分矩阵中第 i行,第 j列的元素,这样区分矩阵的定义是: (c ij) 其中 i,j1,2,3,n,这里 n 。在获得区分矩阵的时候,还有一种情况没有列出来,就是a( xi)a( xj),D( xi)D( xj)的情况,在有些资料中,将这种情况下的 cij赋了一个1;有些则不讨论这种情况,因为他们认为在数据表的预处理阶段会对数据表中冲突的记录做处理,使其不加入到数据中,并且将冲突的记录数除以记录总数,得到一个粗糙度的量度,该

4、量度可以作为数据表的一个特征。本文遵从后一种处理方法,对冲突的记录不予讨论,认为数据表中没有冲突的记录。定义2:区分函数是从区分矩阵中构造的,方法是把 cij的每个属性“或”起来,然后再“与”其所有的 cij,其中i,j1, ,用 p来表示。区分矩阵是一个对称 矩阵。在实际应用中,只计算它的上三角矩阵或下三角矩阵。根据区分矩阵的概念,有三点值得注意: 区分矩阵中条件属性组合数为1的元素项,即Card(c ij)1,表明除该属性外其余条件属性无法将决策不同的两条记录区分开来,即该属性必须保留,这个与决策表中核的概念一致。因此,矩阵中所有条件属性组合数为1的属性均为核属性。 区分矩阵中凡是条件属性

5、组合中包含有核属性的矩阵元素都可以仅用核属性就把决策不同的记录区分开来,也就是说属性组合中凡是包含有核属性的区分矩阵项的其它条件属性都是多余的。 对于不包含核属性的属性组合必然每个组合都至少有一个元素成为约简后的一个条件属性,否则决策表中的某些记录将无法识别。属性约简的基本过程如下:第一步:生成区分矩阵,将矩阵中属性组合数为1的属性列入最终的属性约简集合,即 Red=Core= cijCard(cij)=1,i,j=1,2,3, 。第二步:从区分矩阵中找出所有不包含核属性且 cij0属性组合 Q,即:Q cijcijCore=,且cij0,i,j1,2,3, 第三步:将所有不包含核属性的条件属

6、性组合表示为合取范式的形式,即:P(cij),cijQ。第四步:将 P转换为析取范式的形式,并进行化简。第五步:根据需要选择不同的属性组合作为约简。 选取约简属性后的信息表,对每个规则求出其核属性,得到各规则的核值。定义:具有相同条件属性而有不同决策属性的对象成为不可分辨的对象。基本思想:考虑依次去掉各个属性,若存在不可分辨对象,则说明该属性为必要属性,即核值。若去掉该属性时,无不可分辨对象,则说明该属性为冗余属性,可省略。 根据核值表产生约简规则。基本算法:输入:信息系统 S=(U,CD, V, f )输出:约简后的决策规则集。步骤: 计算区分矩阵; int i=1,j=0;int k=ca

7、rd(U);M=;while(1ik)for(i=0;i+;ik)for(j=i+1;j+;jk)if (D(xi) D(xj)mij=a C:a(xi) a(xj)elseM=M m ij 得到 CORE; i=1; CORED(C)=; 从头取 M中元素,若为单一属性组合则将该属性加入 CORED(C), 进行属性约简 从 M中删除含有核属性的组合。 Q cijc ijCORE D(C)=,且 cij0 P(c ij) 将 P转换为析取范式的形式 P=(c i*) c i*为约简的属性集合一约简的属性集合 ci*,对每一个规则求核属性for(j=1;j+;jm) (m 为每个规则的属性个数

8、)每次假设从规则中去掉一个属性 ajif 不存在不可分辨的规则 then 去掉该属性else a j为该规则的属性核值 根据每一规则的核值,列出约简的规则集合。若对每一个对应的决策值该规则组合是既约的且在系统中为真时为约简规则。 求出各约简属性的权重。通常情况下,决策者会拥有对各个条件属性的先验知识,权重用来衡量属性的相对重要性。在不同的决策环境下,相同的属性对决策输出会有不同的影响,即权重对环境敏感。粗集理论中的属性重要度表达了当前数据环境下属性对决策的影响,但它不能反映决策者的先验知识。因此,将二者结合起来确定属性的权重可以得到比较理想的结果。这样我们将粗集理论同决策者的先验知识结合起来,

9、即将由大量的历史数据确定出来的客观的属性重要度同由主观的先验知识确定的属性权重结合起来确定最终的综合权重,从而实现主观先验知识同客观情况的统一。我们假设系统中的条件属性为 C,决策属性为 D。在 C中有 n个属性 a1,a2,an。由决策者先验知识给定的权重分别为 p(a1), p(a2), , p(an)。然后收集大量的评价样本,由这些样本数据来考察所有条件属性将样本划分为决策类的分类能力,并由决策属性对条件属性的依赖度 rC(D)=Card(posC(D)/Card(U),其中 Card表示集合的基数。然后去掉条件属性 i后,在重新考虑分类情况,求出 rCi (D)=Card(posCi

10、(D)/Card(U),则属性 i的重要度为 rC(D)r Ci (D),以此类推。在此基础上将各个属性的重要度进行归一化处理并把处理后的结果q(a i)作为属性 i的客观权重。即 q(a i) 。显然,q(a i)在0和1之间取值。得到各个属性的主观和客观权重后,由于客观权重是由历史数据处理后得到的,我们赋予其较大的权重为60,相应地,赋予主观权重为40,那么,由此确定的综合权重 P(a i)0.6p(a i)+0.4q(a i)。 3 应用实例 数据采集。在人力资源评价中,各属性值用3,2,1分别表示“优,中,差”。 指标对象知识量a创新能力b交流能力c适应能力d毕业院校e健康状况f心理承

11、受能进取欲望h评定 结果 i力g1 1 1 2 2 2 3 3 3 22 1 1 1 2 1 1 3 2 13 2 3 2 1 1 2 1 2 34 1 2 1 2 1 2 1 1 15 3 1 2 2 2 3 3 3 36 2 2 3 2 2 3 3 3 37 2 2 1 1 3 1 2 2 28 2 3 3 3 1 2 2 3 3 使用区分矩阵进行属性约简,建立区分矩阵如下 1 2 3 4 5 6 7 81 0 cefh abdefgh bcefgh a abc 0 abcdefg2 0 abcdfg 0 acefh abcefh abdeg abcdfgh3 0 abcdh 0 0 bc

12、efg 04 0 abcefgh acefgh adefgh abcdgh5 0 0 abcdefgh 06 0 cdefgh 07 0 bcdefh8 0从区分矩阵可以看出,a 为核属性,因此可以获得Q(cefh)(bcefgh) (bcefg) (cdefgh) (bcdefh),根据吸收律,Q (cefh)(bcefg),将其转换为析取范式后,得到Q(bh)(gh) (c) (e)(f),因此a,b,h,a,g,h,a,c ,a,e ,a,f 都可以作为约简后的属性。 取a,b,h来进行规则挖掘,生成核值表。 属性约简表 核值表 根据核值表,生成规则约简表 得出规则:b1h2a 1i 1,即创新能力为差且进取欲望为中时或知识量为差时,综合评估为差。a1h3b 2h2i 2,即知识量为差且进取欲望为优时或创新能力为中且进取欲望为中时,综合评估为中。a2b3a 3b1h 3i 3,即知识量为中且创新能力为优时或知识量为优且创新能力为优时或进取欲望为优时,综合评估为优。 计算各约简属性的客观权重。由属性约简表得,其条件属性集 Ca,b,h,决策属性集 Di,U/ind(a,b,h)=1,2,3,4,5,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 学术论文 > 社科论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报