1、信用评分普适性与客户化问题 鹏元征信有限公司 钟嘉明 由于评分资料来源和评分结果的用途不同, 在建立个人信用评分系统时会依据最终的评 分目标出现普适性和客户化两种模型体系。 客户化评分系统是根据单个授信人过去的决策做 出判断。通常授信人通过参与取样、属性选择、以及决策应用来影响实际的模型。这样的模 型往往是个人的,只对于个体的授信人适用。普适性评分系统是基于数个出借人以往的经验 进行评判,得出一般情况下受信人的信用情况。 一般来说,建立信用评分体系的各项条件是不可能完全得到满足的,因此在决定采用普 适性评分模型还是客户化评分模型时,必须在理想条件和现实实施环境之间找到平衡。下面 是国外授信人在
2、选择信用评分模型时通常要考虑的问题。 一、模型开发的可行性 1、历史出借经验 由于建立客户化评分模型时需要对以前的决策进行分析, 授信人必须给出以往的信用记 录。也就是说,没有历史数据就等于没有客户化信用评分模型。在建立客户化模型时,首要 的问题就是, 有什么数据以及它们和理想数据之间的差距有多大?理想的评分模型应该是相 同的产品在产生相同历史数据的市场地区和经济环境下应用, 比如对银行信用卡的处理经验 用于处理汽车贷款就不合适。 普适性评分模型是建立在包含大量信用经验数据的信用局数据文件基础之上的。实际 上,这包括了几乎所有授信人的经验。尽管对于不同信用类型、不同决策要求甚至偶尔对不 同地区
3、都有普适性信用评分模型存在,但这些模型都不是建立在个别授信人的经验基础之 上。 2、数据保有情况 用于支持以往决策的信息必须用可以再利用的方式保存下来, 以供建立客户化评分模型 之用。举例来说,当对新申请者进行评价的时候,就会有信用申请以及信用局报告,这些都 是在开发模型时有用的信息。尽管美国法律要求授信人在事件发生后的 25 个月里保留相关 信息,但对于开发信用评分模型来说常常需要有更长时间的数据。 从二十世纪九十年代早期以来,信用局开始以月或者季度为单位将他们的报告存档。这 些档案文件将保存相当长时间,以用于开发和应用普适性信用评分模型。 3、以往决策的结果 对于以往授信决策的结果必须要有
4、以数据形式保存的资料。比如,受信人账户的支付情 况可以作为决定受信人信用行为好坏的依据。建模前,对历史支付数据的详细程度必须进行检查。数据保存和清理的过程也非常重要,举例来说,如果授信人已从记录当中清除某些有 用的账户信息,建模时就必须要恢复这些账户的数据。 一方面,信用局掌握的数据远不如授信人内部掌握的数据细致;另一方面,他们掌握的 历史支付数据是来自于大量的信用关系,支付行为依授信人的不同而不同,因此建立普适性 评分模型的时候,分辨以往决策结果是非常复杂琐碎的工作。 4、决策的周期 为了确保能够得到合适的决策结果并对结果做出适当分类,决策的周期必须足够长。举 例来说,银行过去三个月批准的账
5、户并不能作为好坏风险的判断依据,而超过 2 年的周期就 可以有这样的作用。另外一极端的情形是,十年前批准的信用卡账户就已经“太老了” ,因 为针对当时申请做出的信用报告已经不能反应如今的情形了。 模型的开发者要决定适当的样 本时间框架,包括在开发样本时间框架中的决策都必须是已经发生的事件。 5、样本容量 信用决策的数量必须足够多以确保足够的样本容量。 信用评分模型的开发者们往往要求 有至少 4500 个申请者的样本(1500 个好的,1500 个坏的,还有 1500 个被拒绝的)来开发 新的客户化评分模型。当然,小规模的授信人或者小规模的信用产品也可以在更小的样本容 量基础之上来开发客户化评分
6、模型。 但是开发者一般不愿意在包含有少于 400-500 个坏账户 的样本基础之上开展开发工作。 如果可以取得足够大的样本,要求预测的小概率事件的结果就可以确定。因为在个人信 用评分中, 坏账户就是小概率事件, 所以可用的坏账户数目就成了建模的限制因素。 实际上, 可用样本的数量往往会影响样本的时间框架: 拥有少量账户的授信人也许会用到 2到 4 年以 前的决策数据,而拥有大量账户的授信人只用到 2 年以前的决策数据。 普适性评分模型可以获得的样本数据通常是巨大的。 开发者常常利用几万甚至是几十万 的样本,在有些情况下甚至是几百万的样本。最初开发的一些普适性信用评分模型是用于预 测破产的,因为
7、很少有授信人会拥有足够的破产案例来支持客户化评分模型的建立。 6、经济因素 在比较客户化评分模型和普适性评分模型时必须考虑到两种模型的成本和收益。 成本包 括开发、实施和管理系统的成本。 二、模型开发过程中的问题 在开发任何信用评分模型的过程中,都会作出大量影响其效果和应用的决策。普适性评 分模型与客户化评分模型的差异很大程度上来源于个体授信人与开发者之间是否存在信息 和决策的交流。在普适性评分模型的开发过程当中,往往没有这样的交互过程。 1、模型的目标 在开发客户化评分模型的时候是由授信人选择要实现的目标。目标可以是一般性的,如 减少新账户的信用损失;也可以是很具体的,如减少核准后的半年期账
8、户的破产概率。目标 的选取将会影响在模型开发过程中对评分结果的定义以及模型的应用。 普适性信用评分模型趋向于采用一般性目标,这是些没有经过特定授信人修正的目标。 同时,不同信用局的普适性信用评分模型有着不同的一般性目标。授信人可能会肯定这样的 一般性目标,或者仅仅认为这样的目标比较接近自己的要求。普适性模型就是为大量授信人 服务的,这些模型一般都很有效。 2、目标人群 目标人群是指将要在模型当中进行评分的申请人。对于一个客户化模型来说,不符合目 标人群要求的申请者将会被剔除在样本之外。举例来说,如果评分模型不会用在学生贷款方 面,那么在样本数据当中就要剔除相应的部分。 如果不基于信用局的数据文
9、件,有时候信用局难以辨别目标人群。举例来说,如果授信 人希望定位在低收入的申请者,那么信用局就会采用一些比如邮政编码的特征来估计收入, 或者采用一个收入估计模型。在客户化评分模型中,授信人也许会要求申请人回答一个有关 收入情况的问题,这使客户化评分模型可以准确判断申请人的收入情况。个别授信人的目标 会影响到样本选取以及基于这些样本建立的客户化评分模型, 而普适性评分模型则不受这一 影响。 3、数据/样本开发 授信人可以通过手工操作方式保存数据,比如纸或者胶片;或者通过自动方式(计算机 文件) ,也可能同时采用这两种方式。任何评分系统的开发都要求数据采用可以用计算机识 别的方式来存储。对于数据的
10、编码要求人工编译和录入,这非常花费时间而且价钱昂贵。自 动方式存储的数据就没有那么麻烦,但是也可能缺少了手工记录的一些细节。还有,计算机 上关于历史支付数据的系统往往与申请人的个人信息是分开的, 这就需要一个匹配和合并过 程。 信用局的数据是完全计算机化的。它的数据库规模庞大,往往在以超过百万的文件当中 保存有关于申请人信用方面的各种细节信息,信用账户以及支付记录,但是没有包括详细的 人口统计方面的资料。 4、对相关变量和独立变量的定义 这里的相关变量是指结果,一般来说也就是指支付行为的好坏。在开发客户化评分模型 时,授信人可以指定这些变量的定义以符合他们的目标。举例来说,一名授信人在认定坏账
11、 之前要求该账目已经超期 60 天,另外一名授信人可能会要求已经超期 90 天甚至更多。客户 化评分模型可以满足这二者的不同需要。此外,历史支付记录来源于授信人自己的文件,这 就可能包含更多的复杂定义。 普适性评分模型当中相关变量的定义是基于信用局对于个体债务的记录。一般,有超期 90 天不还款或其他不良历史记录的就会被认为是坏账户,当然也有一些特例的情况。因为 受信人通常会根据债务类型不同实行不同的还款策略, 不同的授信人就会从不同的角度来看 待信用局的文件。 这里的独立变量是指决定信用分值的特征。在给新申请人评分的客户化评分模型当中, 独立变量往往来源于申请报告和信用局报告。当和外部的开发
12、者一起工作时,授信人常常参 与到一系列的决策过程中:哪些变量需要检验,变量的建立以及结构,哪些变量组成最终的 模型。这些信息往往是非常重要的,因为授信人知道这些数据的质量并且理解他们的目标市 场,同时可以承担由此带来的不利后果。 在普适性评分模型当中,独立变量由信用局和开发者指定。通常情况下,只采用信用局 的数据,而几乎不采用授信人另外的信息。实际上,授信人并不知道变量的组成和结构,但 是授信人可以采纳信用局给出的拒绝授信原因。 5、模型开发过程 对于客户化评分模型, 授信人可以通过选择开发公司和评分技术来开发符合特定目标的 评分模型。 而在普适性评分模型的开发过程中, 授信人不能够选择所采用
13、的技术手段。 其实, 处理相同问题的普适性评分模型和客户化评分模型采用的技术手段往往是一样的。 6、被拒绝的申请者 对于客户化评分模型, 由于授信人只保存了那些通过申请检查并且有信用借贷或消费行 为的申请者记录, 从而导致因为缺乏那些被拒绝申请者的记录而带来的统计上和实际上的问 题。开发者一般都试图通过拒绝推断来弥补这一问题。拒绝率越高,问题就越严重,拒绝推 断所能弥补的效果就越小。 因为信用局的记录当中包含了几乎所有潜在信用申请人的支付记录 (除了那些信用市场 的新进入人员) ,在普适性评分模型的开发过程中就几乎没有这个问题了。 7、开发时间 开发一个客户化评分模型通常需要 3 到 12 个
14、月的时间,实施需要的时间更长,一个月 到一年都有可能。而普适性评分模型已经存在,在市场中就可以买到。有时候,授信人的需 求非常迫切,所以购买普适性评分模型就成了唯一选择。 三、应用实施问题 授信人必须能够成功地将评分模型应用到实际当中去, 应用与模型预测的准确性有着同 等重要的地位,如果不能够应用,那么无论是购买还是开发一个评分模型都没有任何意义。 关于应用的问题包括信息编译与登录,计算机自动化,行为预测,评分结果的确认及监控, 拒绝行动的原因,共享的经验和建议,安全性以及管理等。 1、信息编译与登录 为了实现大部分评分系统的功能,必须将申请者的资料信息输入到计算机里。准确并且 一致的表达某些
15、信息有些时候是非常困难的,但为了开发样本,必须要保证数据的准确性和 一致性。在运行着的生产环境当中,得到这样标准的数据非常困难并且代价昂贵。 客户化评分系统和部分普适性评分系统要求进行大量的数据录入。 普适性评分模型只需 要进行最小的信息录入即可(以鉴别申请者) ,这些信息通常可以通过申请人的申请表格得 到。 2、计算机自动化 几乎所有的评分系统实现的时候都运用了计算机。 不同的客户化评分系统在一般信息录 入、编辑以及检查、特例条款和政策实施、计算分值、额外信息录入(如果有必要) 、行动 建议以及拒绝授信的原因方面会有所不同。 用于实现客户化评分模型的软件可以内部开发或 者直接购买。有时候,实
16、施可以通过第三方来实现。 普适性评分模型由信用局来实现, 信用局会向授信人给出受信人的信用评分和采取拒绝 行动的原因。这些模型不对信用局以外公开。当然,为了能够使用信用局的资料,授信人也 必须将他所掌握的受信人信用记录,对信用借贷申请的评判结果等信息提供给信用局。 3、评分结果预测 对于客户化评分模型来说,进行评分结果预测相对要容易一些。比较典型的情况是,开 发人员会从授信人掌握的资料中挑选信用情况已知的样本进行模型的研究开发。 普适性评分模型的评分结果预测是建立在对运用了标准输出定义的大量样本文件进行 分析的基础上的。尽管信用局也可以提供多种预测,授信人仍不能从普适性模型中得到像在 应用客户
17、化模型时的灵活性。当然,授信人可以向信用局提供一个账户列表,得到做出决定 时这些客户的信用局历史评分数据,做出客户化的一般信用局评分行为报告。实际上,信用 模型的预测效果会随着变量与结果之间关系的变化而变化, 信用局通常将为授信人提供客户 化的预测作为他们的服务之一。 4、评分结果确认及监控 所有的授信人都必须知道他们的系统是如何工作的,以便对其进行管理。进行监控以做 出相应的反应非常重要,同时对模型的有效监控可以提供大量的有用信息。 为了监控评分模型的效果,在决定授信时的分值信息必须保留下来。在客户化评分模型 当中,记录是计算机自动进行的,这一信息可以便利地与支付行为相匹配。这些分数以及输
18、入的信息对于将来的分析十分有用。 采用普适性评分模型则需要额外的努力来记录这些分值并将其与历史支付记录合并。 因 为授信人不能随申请人的加入自动接收来自信用局的报告, 所以无法分析详细的信用局数据并将这些数据与评分结果比较。 5、拒绝授信的原因 授信人必须为拒绝授信提供相应的理由。 一般授信人都希望这些理由能够以温和的方式 提出,同时,这样的理由也必须准确而且符合授信人的意图。在评分系统开发完毕以后唯一 的控制就是选择适合的理由然后用适合的语言来表达。 在客户化评分模型当中,授信人对此有着完全的控制。而使用普适性评分模型的授信人 则只能够收到与此相关的信息片断,因为他们既没有对方法进行选择的权
19、力,也不能清楚地 了解评分特征,他们对模型的控制能力非常小。 6、经验和建议的共享 因为每一种客户化评分模型都是独特的,授信人之间不能够对此进行交流。而那些使用 相同的普适性评分模型的授信人就可以对此进行交流,共享他们的经验。另外,信用局和模 型开发者也会对授信人提出他们的建议。 7、评分系统的安全性 评分系统的细节必须是保密的。 客户化评分系统的保密问题是开发该系统的授信人个人 的事情。同时对软件和评分实施过程也要进行相应的保密。 普适性评分系统的细节对于那些不需要知道的人来说并不是完全公开的。 使用这些模型 的授信人并不知道这些细节。即使这些细节公开了,对于分数的操纵仍然非常困难,因为这
20、首先需要能控制信用局掌握的数据文件。 8、管理问题 信用评分系统的管理是系统成功实施的关键问题。 管理问题应贯穿于实施过程当中的每 一个步骤。一般,普适性评分系统的管理不像客户化评分系统的管理那样苛刻,因为一部分 的管理工作已经由该评分模型的提供者完成了,他们不再在授信人的管理范畴之内。 四、信用决策的类型及和可用的模型 在普适性评分模型和客户化评分模型之间做出选择(或者是二者的结合)的最后一个考 虑因素就是信用决策的类型和可用的模型以及他们的优缺点。 信用决策有很多种,它们关注于不同的信用商品。有一些信用决策就是普适性评分模型 的本质属性,如对信用申请的预先甄别。美国的三家信用局都为这些特定
21、的目的提供了相应 的评分模型。在这种情况下,是不需要受信人提出信用申请的,唯一的信息就是信用局提供 的信息,授信人很少会根据信用局的信息再来开发客户化评分模型。在有些情况下,普适性 评分模型有着天然的优势,如那些紧急申请,一般授信人对这类申请人的信息往往很少。 还有一些时候,如果授信人要做出那些信用局报告只能提供有限信息的决定,就会非常 困难。这个时候,最有用的信息来源于信用申请。根据授信人以往经验开发的客户化评分模 型将会是更为有效的手段。 还有很多授信人在面临这种情形时使用客户化评分模型与普适性 评分模型的结合体。 在对信用产品组合进行评分方面,普适性评分模型占有核心的地位。它们为组合风险的 评分提供了标准化的手段和尺度。 通过普适性评分模型, 不同的信用产品之间可以进行快速、 准确的比较。这方面,客户化评分模型显得力不从心。 另外, 授信人在普适性评分模型和客户化评分模型之间做出选择的时候必须要考虑到自 己的实力。通常情况下,在使用和管理评分系统方面有优势的授信人应该选择客户化评分模 型,或者是客户化模型与普适性模型的结合,这样的授信人可以因此获得最大的收益。 对于人员有限的授信人来说,普适性评分模型就成为最优选择。他们可以为今后采用客 户化评分模型积累经验。