收藏 分享(赏)

基于快速蚁群的银行客户信息属性约简算法.pdf

上传人:weiwoduzun 文档编号:1761716 上传时间:2018-08-22 格式:PDF 页数:5 大小:300.73KB
下载 相关 举报
基于快速蚁群的银行客户信息属性约简算法.pdf_第1页
第1页 / 共5页
基于快速蚁群的银行客户信息属性约简算法.pdf_第2页
第2页 / 共5页
基于快速蚁群的银行客户信息属性约简算法.pdf_第3页
第3页 / 共5页
基于快速蚁群的银行客户信息属性约简算法.pdf_第4页
第4页 / 共5页
基于快速蚁群的银行客户信息属性约简算法.pdf_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

1、2015年第24卷第10期 http:wwwcSaorgcn 计算机系统应用 基于快速蚁群的银行客户信息屙l生约简算法 马胜蓝 (福建省农村信用社联合社科技服务中心,福州350001) 摘要:银行客户群体细分对于业务营销具有深远的意义,客户信息具有数据量大、维度高、变化需求频繁的特 点,为此需要引入一种快速的属性约简算法,以满足关键属性快速提取进而构建决策的要求本文通过改进传统 的基于蚁群的属性约简算法,优化每次迭代过程中的蚂蚁搜索的集合转移策略,提出了一种基于快速蚁群算法 的属性约简算法多个UCI数据集实验计算表明提出的新算法求解速度优于传统的基于蚁群算法的属性约简算 法,并且求解质量较优;

2、最后通过银行客户数据进行实践,验证了该算法的可行性 关键词:客户信息;粗糙集;属性约简;蚁群算法;快速提取 Attribute Reduction of Bank Customer Information Algorithm Based on Quick Ant Colony Optimization MA Sheng-Lan (Science and Technology Service Center,Fujian Rural Credit Cooperatives,Fuzhou 350001,China) Abstract:As bank customer segmentation has

3、 a profound significance for business marketing,while customer information has the characteristics of large amounts of data high dimensions and frequently-changing demand,we need to introduce a fast algorithm for attribute reduction to meet the needs of rapid attribute extraction to construct decisi

4、onsThis paper proposes a new quick attribute reduction based on ant colony optimization by improving the collection for each iteration of the ant search transfer strategyNumerical experiments on a number of UCI datasets show that the proposed new algorithm has a lower computational cost than the tra

5、ditional ant colony-based attribute reduction algorithm and a better solution qualityFinally,the feasibility of the proposed algorithm is verified through the use of the bank customer data Key words:bank customer information;rough set;attribute reduction;ant colony algorithm;rapid attribute ext=ract

6、ion 目前商业银行常用的客户分类方法是基于经验方 法和统计方法的简单划分,但是这些方法无法满足日 益增长的数据量以及日益复杂的分析需求,单是按照 历史曰均存款额度作为客户的细分属性,就会造成客 户的数据呈高维状态,更何况现如今银行的客户数据 都是千万级的,数据的处理时效性也是需要重点考虑 的【】I2因此利用粗糙集能够保持客户数据本身的语义 特征【3】,通过客户信息的约简就能很好地对客户进行 分类由于求解信息系统最小约简是一个NP难问题, 若干学者也提出了不少最小属性约简算法4-13其中 基于蚁群算法的属性约简算法搜索质量较好,但是在 收稿时间:20150204;收到修改稿时问:2015040

7、2 每一次搜索迭代过程中,每只蚂蚁都要不断逐个添加 属性值,如果条件属性非常大时,属性选择过程将会 非常耗时为此,本文提出了一种基于快速蚁群算法 【 4】【 的属性约简算法,通过优化蚁群的每次迭代的转 移策略,在每次迭代开始时仅删除最初始的移动集合 元素,并且让蚂蚁从当前的最新点继续搜索访问,而 不是从最初始的起点开始,这样子就可以保证每只蚂 蚁开始于不同的属性并且保留大部分的转移属性集合, 缩减蚂蚁的转移次数,使之通过少量的迭代就可以获 取到令人满意的属性约简结果,满足时效性及高维数 据约简的要求 Software TechniqueAlgorithm软件技术算法217 计算机系统应用 ht

8、tp:llwwwSao唱ca 2015年第24卷第10期 本文后续部分的结构如下:第二节简要介绍粗糙 集理论;第三节阐述基于快速蚁群算法的属性约简算 法;第四节结合UCI数据集进行实验结果比较,并利 用银行客户信息数据进行应用性验证 1基本概念和记号 为叙述方便起见,首先简单回顾粗糙集理论的一 些基本概念16【17 四元组S=(U,A,V, )是一个信息系统,其中: U:对象的非空有限集合,即论域: A:属性的非空有限集合,信息系统中A常分为 条件属性C和决策属性D: V=U Va, 是属性的值域; 厂:UA V是一个信息函数,它为每个对象 的每个属性赋予一个信息值 设集合 ,尸是一个等价关系

9、,称 为集 合 的P下近似集; 为集合 的P上近似集: = IxeU,且 P X) : I U,且 1P n X 设尸和Q为论域上的等价关系,Q的尸正域记作 POSP(Q): POSP(Q):U uO (Q):PO Sp(Q)I IuI 属性约简是去除一些冗余的属性而不减少原来集 合的分类质量一个约简可以定义如下: Red= C l YR(D)= (D), c R, ( ( 一个数据集可能有多个属性约简,最小约简是指 包含属性个数最少的一个属性约简 2基于快速蚁群算法的属性约简算法 0一AntRSAR 基于原始蚁群算法的属性约简算(AntRSAR)埽 首先产生跟条件属性个数一样多的蚁群,在每个

10、条件 属性处放置一只蚂蚁(该条件属性集合构成了一张图) 每只蚂蚁在每次迭代中根据当前走过的条件属性集合 选择下一个条件属性,一直到找到一个约简为止:之 后更新信息素浓度在下一轮循环中每只蚂蚁继续放 置于不同的特征处,重复计算约简对于第k只蚂蚁 从特征点i移动到下一个特征点i的概率可以定义为: 218软件技术算法Software TechniqueAlgorithm p : 。 lp, 6 “ (f) (f) 为第k只蚂蚁未访问过的特征点,J 3 CR; ,7 ( )为处于特征点i时选择特征点J的启发式知识: f,(f)为边(ij)的虚拟信息素: f (t+1)=pr ,(f)+Ar (t) =

11、 RgbRg 目前为止最优的约简 基于原始的蚁群算法的属性约简算法在每一次迭 代过程中,每只蚂蚁都要不断逐个添加属性值;如果 条件属性C非常大时(qOn银行客户属性信息),属性 选择过程将会非常耗时,为此本文提出了一种基于快 速蚁群算法的属性约简算法 该优化的算法思路基于在第t次迭代结束后,每只蚂 蚁的移动集合应该为xl,X2,X3,X4, ,x1到X 是随着蚂蚁的转移规则而排序,显然X。为蚂蚁的初始 位置在原始的基于蚁群的属性约简算法中,在t+1次 迭代过程中,蚂蚁的移动集合将会仅保留x ,这就类 似删除绝大多数蚂蚁的走过的集合,但若仅删除1 个移动集合元素,而让蚂蚁从当前的最新步骤开始继

12、续访问,将可以缩减蚂蚁的转移次数由于是从蚂蚁 的最新步骤开始继续访问,这就类似蚂蚁是在不断的 在寻找,而不是从最初始的起点开始,为此将该改进 的算法命名为OAntRSAROAntRSAR在每一轮访问 结束后删除第二个和第三个访问过的位置,这样子可 以保证每只蚂蚁开始于不同的属性并且保留大部分的 转移属性集合(在什1次迭代时蚂蚁的子集将为 xl,x4,xn),既保持着蚁群搜索的多样性能力, 又降低了转移开销 OAntRSAR的流程图如图1所示 3 实验 本章采用UCI数据集和银行客户信息验证基于快 速蚁群算法的属性约简算法的可行性 3I UCI测试数据集 首先,本节采用11个UCI数据集来测试提

13、出的搜 索机制的可行性具体的数据集信息如表1所示 2015年第24卷第10期 http:wwwc-s-aorgcn 计算机系统应用 图1 OAntRSAR算法流程图 表1 UCI数据集 实验过程中,每个算法在数据集上以不同的初始 值计算20次本文比较0AntRSARAR和其它7种属 性约简算法(基于蚁群算法的属性约简算法 (AntRSAR)n引、基于粒子群(映射粒子速度)的属性约简 算“(PSORSFS)t 、基于标准二进制粒子群属性约简 算法(PSOAR) 们、基于禁忌的属性约简算法 fTSAR) ”、基于遗传优化的属性约简算法(GeneAR) 和基于自适应变异的属性约简算法(AMPSOAR

14、)t 、利 用Hu 】的算法求解的属性约简的长度)的求解质量和 计算开销 如下表2显示了AntRSAR和0AntRSAR在20 次迭代计算中的平均迭代次数和时间开销;从这张表 可以看出0AntRSAR的搜索结果与AntRSAR相当, 在I 1个数据集上计算平均耗时均少于AntRSAR,在 DNA数据集上耗时缩减30而搜索质量相当;同时可 以看出在Led24数据集上虽然OAntRSAR的迭代次 数比AntRSAR多,但是整体耗时比AntRSAR低,这 也说明了OAntRSAR的每次迭代搜索速度比 AntRSAR快因此OAntRSAR的计算开销远低于 AntRSAR算法 表2 AntRSAR和O-

15、AntRSAR的计算开销比较 如下表3列出了比较的9种算法在20次实验过程 中获得的最小约简的长度和数据集最小属性约简 (Best)长度 从这张表可以看出来O-AntRSAR在测试的1 1个 数据集上都可以搜索到最优约简,而TSAAR、 SPSOAR在Led24上都无法搜索到最优约简,因此 O-AntRSAR搜索能力优于TSAR、SPSOAR和Hu,与 GameAR、PS0RSFS、GeneAR、AMPSOAR搜索效率 相当因此本文提出的算法从计算开销和搜索效率上 都能够满足实际要求 32银行客户数据属性约简 银行客户信息主要体现在客户的公共信息、财务 Software TechniqueAl

16、gorithm软件技术算法219 计算机系统应用 http:wwwc-S-aorgcn 2015年第24卷第lO期 信息、电话信息、地址信息及历史财务信息等,对于 银行客户信息营销主要目标是在企业级的客户单一信 息视图基础上,着眼于富裕客户,实现对公、对私业务 的整体联动营销以及高端客户的获取机制,提高理财 经理对个人客户的管理能力,提供差异化服务,从而 推动个人理财业务的发展;实现对公客户营销方式由 “粗放式”个体关系营销模式向“精细化”团队营销模式 的转变,提高对重点行业、重点客户的销售过程(商机) 管理水平,加强对客户经理的业绩统计与评估因此 银行的客户信息维度是极其丰富的,对于银行信息

17、客 户的细分就需要提取出来关键的属性 表3八种属性约简算法约简结果比较 现对某农商行的客户信息建立条件属性和决策属 性(共计26个条件属性),如下表所示 表4银行客户信息属性集合 属性 备注 条件 客户类别 1一个人2一对公3一金融(同业)4- 属性 联名 证件类别 国家代码 开户日期 社员(股东)标志 不是1一是 授信额度 公司类别 对公客户 所有者性质 对公客户 经济组织形式 对公客户 经济类型 对公客户 单位性质 对公客户 免税标志 对公客户 银企合作标志 对公客户 注册币种 对公客户 内部评估级别 级别分为AAA、AA、A、B、待评级 贷款卡年审标志 0一未审1一己审 月均存款状态 0

18、_高于同类1一低于同类 年均存款状态 o_高于同类l一低于同类 第一季度存款额度 高于同类1一低于同类 状态 220软件技术算法Software TechniqueAlgorithm 第二季度存款额度 高于同类1一低于同类 状态 第三季度存款额度 o_高于同类1一低于同类 状态 第四季度存款额度 0_高于同类1一低于同类 状态 决策 客户分级 1一高价值客户2一一般客户3一低价值 属性 客户 (该评定数据根据前期的客户评级结果 导出1 采用OAntRSAR对脱敏的部分存量客户数据(35 万条数,对公和对私客户各抽取一半)进行属性约简, 得到属于约简集合R为“客户类别、国家代码、社员(股 东)标

19、志、公司类别、银企合作标志、内部评估级别、 月均存款状态、年均存款状态”,利用该8个条件属性 就可以完成后续的客户分类规则计算同时,这8个 条件属性也从直观上也说明了属性约简的可行性,例 如股东标识为1并且客户类别是2时,客户分级为1一 高价值客户 4结语 目前包括蚁群算法在内的诸多群智能算法都用于 解决属性约简问题基于蚁群算法的属性约简算法具 有很好的约简结果,但是计算开销较大本文提出的 3 4 8 9 4 2 9 9 8 4 3 4 8 9 4 2 9 m 8 4 3 4 8 9 4 2 9 9 8 4 3 4 8 9 4 2 9 9 8 4 罂 m 眦鹕 4 一一一 2015年第24卷第

20、10期 http:HwwwcSaorgcn 计算机系统应用 改进的基于蚁群算法的属性约简算法,在蚁群的转移 策略上优化了初始节点的集合,降低了蚁群算法的搜 索开销通过11个UCI数据集验证了本文提出的算法 的可用性,并且在银行客户数据约简上也做了应用上 的验证然而,基于蚁群算法仍然存在着不足:在数 据集具有非常大的条件属性条件下,蚂蚁的群体个数 将会变大 参考文献 1邵兵家客户关系管理:理论与实践北京:清华大学出版社, 2004 2汤亚玲,黄华,程泽凯基于自适应遗传神经网络的银行客户 分类研究计算机技术与发展,2014,24(7):192195 3 Jensen R,Shen QSemanti

21、cspreserving dimensionality reduction:rough and fuzzy-rough-based approachesIEEE Transon Knowledge and Data Engineering,2004,16(12): 1457-1471 4 Wroblewski,JFinding minimal reducts using geneticgofithms Procof the Second Annual Join Conference on Information SciencesWrightsville BeachNC1995186-189 5

22、 Jensen RShenQFinding rough set reductswith ant colony optimizationProcof the 2003 UK Workshop on Computational Intelligence200315-22 6 Hedar A Wang J,Fukushima MTabu search for attribute reduction in rough set theorySpringer-VerlagSoft Comput, 2008,12(9):909-91 8 7 Wang xY,Yang J,Peng NS,et a1Findi

23、ng minimal rough set reducwithparticle swamaoptimizationSpringer-VerlagBerlin Heidelberg200545 1-460 8马胜蓝,叶东毅一种带禁忌搜索的粒子并行子群最小约简 算法智能系统学报,2011,6(2):132141 9马胜蓝,叶东毅一种基于博弈策略的群智能属性约简算法 计算机工程与应用,2012,48(1):145149 1O马胜蓝,叶东毅信息熵最小约简问题的若干随机优化算 法研究模式识别与人工智能,2012,25(1):96-104 11程美英,倪志伟,朱旭辉基于生命周期的二元蚁群优化算 法模式识别与

24、人工智能,2014,27(11):10061014 12滕书华,鲁敏,杨阿锋,等基于一般二元关系的粗糙集加权 不确定性度量计算机学报,2014,3:649-665 13韩素青朋桂梅一种面向用户需求的属性约简算法模式 识别与人工智能,2014,27(3):281-288 14 Maniezzo V Colomi AThe ant system applied to the quadratic assignment problem Knowledge and Data Engineering,1999,11(5):769-778 1 5 Dorigo M,Maniezzo Colorni AThe

25、 ant system: optimization by a colony of cooperating agents IEEE Transon Systems,Man,and Cybernetics,Part B,1 996, 26(1):29 1 16王国胤Rough集理论与知识获取西安:西安交通大学出 版社2001 17张文修,梁怡,吴伟志信息系统与知识发现北京:科学出 版社。2003 18DengTQ,YangCD,ZhangYT,WangXXAnImprovedAnt Colony Optimization Applied to Attributes Reduction German

26、Springer-Verlag Berlin Heidelberg20091-6 19 Wang X Yang J,Peng NS,et a1Finding Minimal Rough Set Reducwith Particle Swarm OptimizationSpringer-Verlag Berlin Heidelberg,2005:451-460 20 Kennedy J,Eberhart RCA discrete binary version of the particle swarlTl algorithmProcof the IEEE International Confer

27、ence on Systems,Man and CyberneticsPiscataway, USA199741O 4109 21 Hedar AR,Wang J,Fukushima MTabu search for attribute reduction in rough set theorySpringer-VerlagSoft Comput, 2008,l2(9):909-918 22吕振肃,候志荣自适应变异的粒子群优化算法电子学报, 20043:416_4l1 23 Hu XH,Cercone NLearning in relational databases:a rough set approachComputational Intelligence,1995,1 1(2) 323-337 Software TechniqueAlgorithm软件技术算法22 1

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 学术论文 > 期刊/会议论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报