收藏 分享(赏)

数据挖掘技术在银行信贷管理中的应用研究-论文.pdf

上传人:精品资料 文档编号:10288900 上传时间:2019-10-28 格式:PDF 页数:77 大小:3.19MB
下载 相关 举报
数据挖掘技术在银行信贷管理中的应用研究-论文.pdf_第1页
第1页 / 共77页
数据挖掘技术在银行信贷管理中的应用研究-论文.pdf_第2页
第2页 / 共77页
数据挖掘技术在银行信贷管理中的应用研究-论文.pdf_第3页
第3页 / 共77页
数据挖掘技术在银行信贷管理中的应用研究-论文.pdf_第4页
第4页 / 共77页
数据挖掘技术在银行信贷管理中的应用研究-论文.pdf_第5页
第5页 / 共77页
点击查看更多>>
资源描述

1、论文编号:1028709 100022硕士学位论文数据挖掘技术在银行信贷管理中的应用研究研究生姓名学科、专业研究方向指导教师尹晓丽管理科学与工程管理信息系统方旭异副教授南京航空航天大学研究生院经济与管理学院二OO年三月、 T一、N画ing UIliVersit)r ofAeron锄tics锄d As臼0IlallticsThe(haduate SclloolCollege of EC0nomics alld MaIlag锄entResearch on Applications of Data MiningTechnology in the Banking CreditMan agement。A

2、啊1esis illMallagement Science a11d En百neeringbyYin Xia01iAdvisedbyAssociate Pr0Fallg XushengSubnlitted in P枷al FulfillnlentOf me Requj托mentsfor the Degree ofMaster Of ManagenlentMarch,2010承诺书本人郑重声明:所呈交的学位论文,是本人在导师指导下,独立进行研究工作所取得的成果。尽我所知,除文中已经注明引用的内容外,本学位论文的研究成果不包含任何他人享有著作权的内容。对本论文所涉及的研究工作做出贡献的其他个人和集

3、体,均已在文中以明确方式标明。本人授权南京航空航天大学可以有权保留送交论文的复印件,允许论文被查阅和借阅,可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段保存论文。(保密的学位论文在解密后适用本承诺书)作者签名:芝盛-目日 期:划2 1墨:熔l南京航空航天大学硕士学位论文摘要随着银行业对信息化建设的重视,信息技术早已广泛渗透到银行业各个机构、各项业务和各个环节。我国大多数商业银行已经建立并逐步完善了以会计核心系统为中心,以个人信贷管理系统、对公信贷管理系统、中间业务系统、管理会计系统等为外围辅助系统的一套较为完整的信息管理体系。在此形势下,我国商业银行便累

4、积了海量业务数据。但是,银行很多重要决策并不是基于这些海量数据,而是基于决策者的直觉。大型数据库中的海量数据变成了“数据坟墓”,甚至成为银行的负担。这归结于缺乏从海量数据中挖掘有用信息的工具,而数据挖掘技术的兴起正好可以解决这一难题。数据挖掘是一个交叉学科领域,汇集了数据库、机器学习、统计学等领域的技术和方法,它能够从大量的银行业务数据中发掘出潜在有用的信息和知识,为管理者提供有效的决策信息,进而能够更加有效地防范和管理风险。本文就银行信贷管理中的风险管理环节进行研究,采用数据挖掘技术实现贷款风险评估。首先研究主要的数据挖掘方法和技术,简单介绍我国商业银行的信贷管理体制;在此基础上提出一个基于

5、数据挖掘的信贷管理系统的设计方案;之后,按照数据挖掘技术的行业标准CsPDM(cro鹳勘d岫r StaIldard Process for Data h位IiIlg),即通过商业理解、数据理解、数据准备、建模、评估和结果发布六个步骤来构建贷款风险评估模型;经过对贷款数据的预处理之后,建立决策树、神经网络及L0西stic回归模型。然后从建模结果、预测精度等角度评价这三种模型,得出贷款风险评估准则;最后对本文的研究工作做了总结,讨论了本研究的局限,并展望未来的研究工作。关键词:数据挖掘,信贷管理系统,贷款风险评估,决策树,神经网络,b西s6c回归数据挖掘技术在银行信贷管理中的应用研究AbstraC

6、tAs t11e b龇1king pays more and mo咒attenlion t0 tlle mf0加1撕0n constlltionillf0棚谰缸0ntechnology ll雒been pene仃ated ill幻州ous agencies,sen,ices柚d eVen all硒pects of nle b锄1kingMost comn圯rcial b锄1ks iIl clli】舱have been esta_blished a conlplete set of缅f(m【Ilation n姗a璺既n肌tsystem,WIlich ta:kes the acc叫ntiIlg s

7、ystcm勰tlle co托,锄d tal【es the p盯soIlal cdit mam萨锄僦s),stelntlle credit mana星聊:Ilent systeIn,the inte如diate b1培iness s),stenl锄d the maIm酽=Ir嘲ntaccoun缅g sySteIn丛a set 0f麟锄ml suppoft systel璐缸a result, mo北觚d mo坨busin器s加acollected ill nle d乏岫ase of me banI【HoweVer,many i如p哦勰t decisions of the ban:k a他not b

8、舔ed onlose讹iIlvolved fich inf0棚舱缸on,bllt on maI埝g粥ill_tIlitionBecautlle balll【doemt hVe tlletool WIlich c觚ex协犯t廿le璐efIll iIlf0彻ation肺m m硒s bI坞iIless data,tllose m勰s dat2L ill nle dalta:b弱etIlm to be“也e讹掣孙re”柚d eVen t0 be the b1埘den ofle ballkThe emergenof data miniIlgtecllIlology can sol、懵tbis pbleI

9、IIData MilliIlg is an interdiscipliIla巧tedmology,colTIbiniIlg tecbIlology and metllods of出也出嬲e,machjne le鲫niIlg,北mstics and硎ler矗eldsData MiIling is able t0 distill use丘ll iI曲mlation andknowledge llidden iIl large ql堪nti6es of讹,WIlich will gfeatly help mana;ers t0 make mowise孤dcofrcct decisi衄s,g删agai

10、llst and m越恻萨cmdit risksTtlis tllesis foc璐es on mesearch on nSk m觚agement of c托dit maIIag即舱nt,c枷es out credit出k舔Ses鲫nent by Data MiIliIlg techologyF证;tit in仃0duces t11e techIlology觚d me也ods ofda组miIliIlg,aIlalyzes the featllres of cred“management in Cllilms bam路Then we design a c心dit mana寥棚僦system b

11、弱ed讹millingAccordiIlg to fhe iIldus仃y stan(Ial旧of Data MiIIiIlg tcchologyCRJSP-DM,mc research sets up me credit risk鹊ses锄饥t脚del wim血c si】【steps:弧妇鼹understaIl血g,胁undellstandiI唱,data p咒p删,modeliIl岛eVal嘣on孤d depl,II圮ntA盘盱prepcessing on dathree memods f10rg up models are lnilized in this也esis:decision仃e

12、e,I硷llral nct and lo百stic regressionAnd tal【iI培model result,IIlis-cl髂sificad确:te嬲geneml e砌uadoncriteda,compa陀the tlle models,and conclude cdit risk雏sessment criteriaFinally,mis tllesisfocus on吼mm谢es of the woks,discusses the lill【litatiOf“ssearch,and tlle e阉)ec切矗next ismentioned iII t量le endKeywords

13、:Data Mi血培,Cre拙M锄ag锄咖SystelIlCredit R斌缸ses姗t,Decisi1ree,NeuralNet,Lo萄stic RegressionH南京航空航天大学硕士学位论文目 录第一章绪论111课题研究背景和意义112国内外研究现状和发展2121数据挖掘技术的研究状况2122数据挖掘技术在银行领域的应用现状313本文研究思路与文章框架。514本文可能的创新点5第二章数据挖掘技术概述721数据挖掘介绍。7211数据挖掘的概念7212数据挖掘系统的体系结构8213数据挖掘的过程与步骤8214数据挖掘的建模方法102141决策树。112142神经网络122143 L0西s如

14、回归:1322数据挖掘在银行信贷管理中应用的理论研究1523本章小结16第三章基于数据挖掘的银行信贷管理系统的体系结构1731我国商业银行信贷管理17311信贷业务处理流程l 7312信贷风险管理的内涵18313信贷风险管理流程19314我国信贷风险管理存在的问题。20315贷款风险评估2032基于数据挖掘的银行信贷管理系统2l32。1系统体系结构2l322系统功能架构22323系统模块结构23III数据挖掘技术在银行信贷管理中的应用研究33本章小结24第四章数据挖掘技术在银行信贷管理中的应用2541确定挖掘主题2542选择数据挖掘工具25421常用数据挖掘工具的分析与比较25422本文选择的

15、挖掘工具2643数据准备。27431数据的获取27432数据的转换28433抽取数据30434数据分析3l435数据清洗324351处理空缺值。324352消除噪声数据33436数据变换:344361数据泛化。344362属性构造354363数据离散化。36437预处理结果3744数据挖掘实施39441建立模型394411决策树模型。404412神经网络模型。454413Lo西stic回归模型48442实验结果分析5045本章小结57第五章总结与展望。5851论文的主要工作5852本研究的局限5853工作展望59参考文献60致谢62在学期间发表的论文及参加的研究课题63IV南京航空航天大学硕士

16、学位论文图表清单图清单图21 数据挖掘系统的体系机构8图22 CluSP-DM过程模型。9图23 人工神经元模型13图31 信贷业务处理流程。1 8图32 信贷管理系统体系结构22图33 信贷管理系统功能架构23图34 信贷管理系统模块结构24图41 选择数据源28图42 对文本文件进行分割29图43 设置文本文件相关字段29图44 动态数据转换30图45 年龄属性值的分布直方图。37图46 构建贷款风险评估模型的流程40图47 输入输出字段设置41图48 部分训练数据集41图49 建模参数设置42图410决策树模型部分结果(1)43图41l决策树模型部分结果(2)。43图412决策树规则集4

17、4图41 3决策树模型概述44图414神经网络模型参数设置45图415神经网络模型参数设置一模型评估46图416神经网络模型47图417神经网络模型概述。47图418 Lo豳廿c节点参数设置48图419 L0西s石c回归模型49图420 L0百s矗c回归模型概述49V数据挖掘技术在银行信贷管理中的应用研究表清单表31贷款五级分类定义21表41主要表信息。27表42抽取属性字段31表43属性预处理结果38表44属性预处理结果(续)。39表45决策树模型判定结果50表46神经网络模型判定结果厶5l表47 b百stic回归模型判定结果5l南京航空航天大学硕士学位论文第一章绪论随着我国银行业信息化建设

18、的发展,各种基础业务系统平台建设的完成,银行业积累了大量的业务数据,这些数据中往往包含着大量隐含的、具有潜在价值的信息和知识。通过数据挖掘技术,从银行海量业务数据中挖掘出有关风险控制和信用评估的知识和规律,指导银行采取有效措施,促使银行合法、审慎经营,防范和化解金融风险。这将成为我国银行业面临的新挑战,也是我国银行业能否在激烈的国际竞争中获得优势的关键所在。11课题研究背景和意义随着我国国民经济的持续发展和社会保障体系的健全,我国居民的收入得到了很大提高,人们的消费观念也随之发生了巨大转变,信用消费逐渐被人们接受并认可,个人信贷业务就是在这样的情形下产生并不断发展的。个人信贷业务以其风险分散、

19、利息收入稳定、市场潜力大等优势成为商业银行的重要战略性业务,国内各家银行都建立了与自身业务特点相符合的信贷管理系统来规范信贷业务流程,实现信贷工作的信息化,从而提高信贷业务人员的工作效率,降低信贷业务风险。近lO年来,我国商业银行信息化工作已取得了令人瞩目的成绩,数据大集中工程后,各行主要业务数据实现全国统一管理,银行业便积累了大量的业务数据。纵观国内商业银行,我们不难发现,大部分银行所基于的数据库系统只能实现数据的录入、查询、统计等较低层次的功能,所谓分析也只是停留在对数据的简单计算和汇总上面【l】。因此,银行虽累积了海量业务数据,但却无法发现这些海量数据中存在的关联关系和业务规律,更难以根

20、据现有的数据预测未来业务的发展趋势。这完全是因为缺乏挖掘海量数据背后隐藏的知识的手段和工具,日益增多的业务数据不但没有为业务决策提供有力支持,反而巨量数据信息的存储成了沉重的负担,甚至导致了“数据爆炸却知识贫乏”的现象。如何有效地利用这些海量业务数据信息,为业务决策提供智能化的支持;如何在数据处理的基础上,建立业务分析和预测等应用系统,为银行业务人员提供准确、高效的决策支持服务,这些都己成为国内商业银行信息化建设中迫切需要解决的问题。数据挖掘技术的兴起与发展为银行业信息化建设提供了契机。数据挖掘是借助于人工智能和高级统计技术,运用聚类分析、神经网络、决策树等技术,从大量数据中抽取出潜在的、不为

21、人知的有用信息、模式和趋势的过程【2】。最终目的在于利用所挖掘的规律和模式去理解当前的行为以及预测未来的结果,并以人们容易理解的形式提供有用的决策知识。随着我国金融改革的不断深入,尤其是我国加入W10以后,国内外银行间的竞争更加地激烈,金融风险也呈现出日益加大的趋势,而银行产品在很大程度上具有同质性。因此,哪家银行可以在竞争中取得优势,往往数据挖掘技术在银行信贷管理中的应用研究取决于谁掌握了客户关系,以及海量的业务数据和客户信息背后所隐藏的业务规律,并能够利用这些独特的业务规律制定决策,进而规避风险。而这些正是数据挖掘需要解决的问题,也是本文要努力尝试解决的问题。基于以上因素的考虑,本课题选择

22、研究数据挖掘技术在银行信贷管理中的应用,着眼于个人信贷业务。旨在通过数据挖掘技术分析银行信贷管理系统数据库中的个人信贷业务的相关数据,实现贷款风险评估,挖掘出各类贷款的特征模式,得出区分贷款类别的最佳分类特征,辅助银行信贷部门的贷款发放和贷款分类的决策。12国内外研究现状和发展121数据挖掘技术的研究状况数据挖掘通常又称数据库中的知识发现【3】,可自动或方便地进行模式提取。这些模式是指从大型数据库或数据仓库中提取的人们感兴趣的知识,这些知识是隐含的、事先未知的但又是潜在有用的,一般可以表示为概念(Concepts)、规则(Rules)、规律(Regularities)、模式(Pattems)等

23、形式。1989年8月在美国底特律召开的第11届国际人工智能会议上首次提出了这个术语,1995年在加拿大蒙特利尔召开了首届知识发现和数据挖掘国际学术会议,以后每年都要召开一次知识发现和数据挖掘国际学术会议。1999年,亚太地区在北京召开的第三届PAKDD会议收到158篇论文,空前热烈。mEE的l函owledge锄dDataEngiIle酣h培会刊率先在1993年出版了KDD技术专刊。并行计算、计算机网络和资讯工程等其它领域的国际学会、学刊也把数据挖掘和知识发现列为专题和专刊讨论,甚至到了脍炙人口的程度。数据挖掘是多门学科和多种技术相结合的产物,其目的是把人工智能、机器学习、神经网络、统计学、模式

24、识别与数据库技术结合起来,由计算机自动从已有数据(数据库或数据仓库)中发现未知的、具有潜在应用价值的信息或模式【3】,解决了“数据爆炸却知识贫乏”的问题。经过十多年的努力,数据挖掘的研究重点已逐渐从发现方法转向系统应用,注重多种发现策略和技术的集成,以及多种学科之间的相互渗透。数据挖掘技术的理论研究和产品开发速度都非常惊人,目前,世界上有不少软件公司已研制出相关的数据挖掘软件产品,如sPSS公司的cl涨ntil圮、毋M公司的hltelligeIlt Mher、SAS公司的EIlte印rise Miller、Ofacle公司的DBMiIler等。随着国外数据挖掘技术的兴起,我国也很快跟上了国际步

25、伐。计算机世界报技术专题版于1995年3月发表了由中国电子设备系统工程公司研究所李德毅教授组织的KDD专题:于1995年4月发表了由中国科学院史忠植研究员组织的“机器学习、神经网络”专题;于1995年12月发表了由国防科技大学陈文伟教授组织的“机器发现和机器学习”专题;于1999年在北京召开的第三届P甜D国际学术会议。这些都对我国开展知识发现的研究起到了一定的推动作用。近几年,国内各计算机学术刊物也纷纷刊登有关知识发现和数据挖掘的论文,所涉及的研究领域集中于学2l南京航空航天大学硕士学位论文习算法的研究和有关数据挖掘的理论研究。122数据挖掘技术在银行领域的应用现状数据挖掘是面向应用而生的。近

26、年来,数据挖掘的应用越来越成熟,效益也逐步体现,尤其是在零售(如超级市场)、电信、保险、银行、交通、医学等商业领域。数据挖掘典型的商业应用包括:客户细分、交叉销售、客户流失分析、信用评分、欺诈发现、销售预测、股价预测、利率预测等。银行信息化的迅速发展,产生了大量的业务数据,且这些数据通常是比较完整、可靠和高质量的。对其进行数据挖掘分析,可以发现其数据模式及特征,然后可能发现某个客户、消费群体或组织的金融和商业兴趣,并可观察金融市场的变化趋势。从银行的海量业务数据中提取出这些有价值的信息和知识,辅助其商业决策,是数据挖掘技术在银行领域的重要应用。数据挖掘在银行领域的应用主要有以下四个方面【4】:

27、1)银行客户关系管理2)银行风险管理3)银行信用等级评估41 银行服务分析和预测根据美国ne 1机惯G胁叩咨询公司的调查显示:1998年全球500家大银行中,已经有近90家建立了数据仓库并使用数据挖掘技术为其服务。据了解,在这500家银行中,目前至少有300家银行己经从事数据挖掘工作了。在欧美银行业中,汇丰、花旗和瑞士银行是数据挖掘技术应用的先行者,最初的应用范围以客户资料分析为主。但是,最终将数据挖掘深层次应用到主营业务中去的是以位NA和FirstUSA为代表的信贷银行,其应用领域主要是信用卡客户的分析【5】。到20世纪90年代末,随着客户关系管理(CRM)的兴起,数据挖掘技术逐渐受到银行业

28、的青睐,美国的美洲银行、英国的皇家苏格兰银行、法国的兴业银行等纷纷采用数据挖掘技术来提高自己的经营能力。在欧美银行业中,数据挖掘在客户分类和档案管理、客户保持和个性化营销、信用卡用户分析、金融欺诈和风险管理、投资组合风险分析以及分支机构管理等方面有着广泛深入的应用。发达国家由于经济和金融领域高度发展、金融市场完备、金融工具丰富、管理技术和科技水平领先,数据挖掘技术已在商业银行中有比较成熟的应用。其中应用最广泛的是基于客户关系的目标市场识别和客户分类、聚类,借以采取有针对性的市场营销手段和客户服务策略。如美国Firs纽银行使用Mark锄an数据挖掘工具,根据客户的消费模式发现客户的金融和商业兴趣

29、,预测何时为客户提供何种产品或服务。银行公共数据库中存储着关于每位消费者的大量信息,关键是要深入分析消费者投入到新产品中的原因,并在数据库中找到一种模式(即消费者的消费模式和习惯),从而为每种新产品找到最合适的消费者。数据挖掘系统根据消费者是否有家庭财产贷款、信用卡、存款证或其它储蓄、投资产品等,将它们分成若干组,然后使用数据挖掘工具预测何时向每位消费者提供哪种产品。这样有助于银行工作人员合理决策,采取有效的市场营销手段和服3数据挖掘技术在银行信贷管理中的应用研究务策略,提高银行的经济效益。数据挖掘同样应用于银行的风险管理中,如Corestatcs银行的零售信用信息系统(Retail Crem

30、th】f0】硼atiSystem,RcIS),通过分析客户和信用业务之间的关系,减少信用风险并监督高风险的帐户。同时可根据现有客户的数据总结客户行为的特点,并预测客户的下一步行动。而蒙特利尔银行(Balll【ofMOIl廿eal),它分析进行抵押的客户在支票、储蓄和其它帐户上的交易历史记录,以此来得出客户拖欠费用的风险。与此类似,美国银行抵押贷款部利用数据挖掘,分析客户行为数据,进而估计坏帐,管理人员在此基础上便可以最优地确定坏帐准备金,而这能直接影响银行的收益率。另外,应用数据挖掘技术预防和侦破洗钱、信用卡诈骗等金融犯罪也是一个重点。可以通过数据挖掘对账户进行信用等级评估、分析信用卡的使用模

31、式、检测信用卡的恶性透支、探测金融政策与金融业行情之间的关联关系、发现隐藏在数据后面的不同财政金融指数之间的联系等【6】。由于金融诈骗行为时有发生,给银行造成了巨大的经济损失,因此进行诈骗识别也备受银行业的关注。对各类诈骗行为进行预测,哪怕正确率很低也会减少诈骗行为发生的可能性。在进行预测时,主要通过总结正常行为与诈骗行为之间的关系和差异,得到诈骗行为的一些具体特征,当某些业务或账户符合这些特征时,便可以向决策人员发出提醒。我国金融电子化建设成绩斐然,极大地促进了我国银行业的创新和发展。但我国银行业的电子化建设主要集中在业务产品和渠道的电子化以及其它基础设施的建设。期间虽然不断引入新的技术,极

32、大提高了交易手段和交易性能,却依然只围绕着银行业务的运作层面,且提供的大都是无差异化的产品。而在银行更高层面的市场营销、风险管理、产品设计、战略决策等方面,相应的信息技术近乎空白,而数据挖掘技术的引入可以很好地解决上述存在的问题。可知,国内银行数据挖掘的应用还刚刚起步,处于积极探索和经验积累的阶段。不过近几年由于国内外金融领域竞争日趋激烈,特别是面临金融市场全面开放的压力,各商业银行都加大了信息技术应用的投入力度,走信息化建设的道路。如纷纷投入资金、技术、人员实施数据大集中战略,将原本分散的各分支机构和网点的各种业务数据集中整合到一起,形成统一管理的信息资源和业务平台【51。完成数据大集中后,

33、纷纷致力于数据仓库系统的建设,但其主要集中在利用多维分析技术的应用,对于数据挖掘的应用还不多。不过,数据大集中和数据仓库的建立,已为国内银行开展深入地数据分析、数据挖掘提供了良好的数据基础。为适应当前的金融形式,我国商业银行在客户关系管理、信用风险管理、贷款偿还风险的预测与控制等都处于探索性的应用状态。学习和应用数据挖掘技术对我国的金融机构有着重要的意义。数据挖掘在银行应用的最高阶段是实现决策支持的“智能化”,即实现金融商业智能(胁ialBuSiness Intelligent,FBI)。金融智能是对银行掌握的信息进行搜集、分析和管理,以使银行各级决策者获得洞察力,促使他们做出对企业更有利的决

34、策【6】。各国银行都应该加快自身信息化建设的发展步伐,应用数据挖掘技术,最终实现决策支持的“智能化“。4一I南京航空航天大学硕士学位论文l-3本文研究思路与文章框架承担风险是银行存在之源,管理风险是银行存在之本【6】。在经济全球化这一大格局影响下,商业银行需要在世界范围内经营业务,所面临的风险也将越来越大越来越复杂。风险管理能力已成为现代商业银行参与全球化竞争的核心要素之一,全世界的商业银行都在全球化构筑的复杂环境下积极培育和完善全面的风险管理能力。对于正经历转型、又恰逢向国际市场全面开放的中国银行业而言,提高风险管理能力是尤为重要和复杂的。如何有效地识别、评价、监控和化解银行不良资产己经成为

35、国内银行业不可回避的问题,而通过高效的信息化技术,可以帮助银行实现风险管理由事后管理向事前管理、由定性管理向定量管理的转变。本文全文的内容框架安排如下:第一章,绪论部分主要分析本文的选题背景和意义,概述了数据挖掘技术的研究状况,及其在国内外银行业的应用现状,提出文章的研究思路和框架,最后列出本文的创新点。第二章,阐述了数据挖掘的概念和技术,目的是在了解数据挖掘理论和技术基础上,结合我国银行信贷管理的现状,选择具体的解决方法。包括数据挖掘的概念、系统体系结构、常用建模方法。重点在于分析数据挖掘在银行信贷管理中的具体应用。第三章,分析我国商业银行信贷管理的业务特点,结合实际情况和数据挖掘技术,提出

36、了基于数据挖掘的信贷风险管理系统的设计方案。第四章,进行具体的数据挖掘实验,实现个人贷款风险评估。主要采用SPSS Cl踟啪缅e120平台分析个人信贷数据,按照其制定的数据挖掘技术的行业标准:CmSP-DM,通过商业理解,数据理解,数据准备,建模,评估和结果发布六个步骤来构建贷款风险评估模型。经过对数据的预处理之后,建立决策树、神经网络及L0百s6c回归模型,然后从建模结果、预测精度等角度评价模型,得出贷款风险评估准则,辅助银行决策。第五章,对本文所作工作进行总结,列出本文研究的局限,并对本次研究工作做进一步的展望。14本文可能的创新点本文拟在充分研究数据挖掘技术和分析我国商业银行信贷管理体制

37、的基础上,针对我国商业银行个人信贷管理系统的贷款风险评估模块,应用数据挖掘技术进行有益探索,从而使得个人信贷风险评估能够做到更加合理有效。这其中最大的创新之处在于:1)在了解了数据挖掘相关技术和我国商业银行信贷管理的业务特点、信贷管理系统的不足之后,提出了基于数据挖掘的信贷管理系统的设计方案,进而完善了我国商业银行信贷管理系统的分析和预测功能;2)将数据挖掘技术引入银行信贷管理中,主要着眼于个人信贷管理。通过分析银行个人信5数据挖掘技术在银行信贷管理中的应用研究贷业务的相关数据,进行有效地数据挖掘,实现贷款风险评估。发现个人信贷数据中隐含的知识和规律,即贷款风险评估的判断标准。为银行信贷部门防

38、范风险提供决策依据,且能够提高银行信贷管理部门的工作效率和决策的科学性。6一南京航空航天大学硕士学位论文第二章数据挖掘技术概述随着信息技术的高速发展,各种形式数据库中的数据呈海量急剧增长,在这些海量的数据里隐藏着大量有用的知识和信息。而只靠人工或简单的数据检索,远不能及时提取出那些不同层次的知识。由此,数据生成和理解之间便出现了越来越大的差距。为了避免这种情况,必需要有一种可以分析大量数据的新型数据分析技术。数据挖掘正是这样一种技术,它使得自动地和智能化地从海量数据中获取有用的信息和知识成为可能。21数据挖掘介绍211数据挖掘的概念关于数据挖掘的定义有很多,这里我们主要从技术角度和商业角度给出

39、数据挖掘的定义:1)数据挖掘的技术定义从技术角度来看,数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中提取隐含在其中的、人们事先不知道的、却又是潜在有用的信息和知识的过程嘲。人们将数据看作是形成知识的源泉,就好像是从含金的大量矿石中淘金一样。原始数据可以是结构化的,如关系数据库中的数据,也可以是非结构化的,如文本、图形、图像数据,甚至是分布在网络上的异构型数据。这些数据可以存放在数据库、数据仓库或其他信息存储中。而发现知识的方法可以是数学的、也可以是非数学的;可以是演绎的,也可以是归纳的。发现的知识可以用于信息管理、查询优化、过程控制、决策支持等。因此,数据挖掘是一门交叉学科

40、,受多个学科影响,包括数据库系统、统计学、机器学习、可视化和信息科学等。它把人们对数据的应用提升到从数据库中挖掘知识,提供决策支持。2)数据挖掘的商业定义从商业应用角度看,数据挖掘是一种新的商业信息处理技术,它把对数据的应用从低层次的联机查询操作,提高到决策支持和分析预测等高级应用上。其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键知识,即从数据库中自动发现相关商业模式【羽。数据挖掘是利用统计学和机器学习的技术来探求那些符合市场和客户行为的模式,按照企业既定的业务目标,分析大量的企业数据,揭示隐藏的、未知的或验证已知的商业规律,并进一步模式化的数据处理方法,以辅助商业决策。若从这一角度考虑,数据挖掘技术只有面向特定的商业领域才有应用价值。7数据挖掘技术在银行信贷管理中的应用研究212数据挖掘系统的体系结构由数据挖掘的概念可知,数据挖掘系统的体

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报