1、SPSS保险业案例分析键入作者姓名保险业案例分析按照我国目前保险业的惯例,对于财产保险公司,可以用 5 个变量来描述其保险业务情况:保费收入、储金、赔案件数、赔款支出和未决赔款。其中,保费收入和赔款支出按保险标的特点分别又分为 9 个组成部分。因此,通过对我国各个财产保险公司的基本情况进行各种分析,一方面找出构成财产保险公司基本特征的各变量之间的内在联系,另一方面找出各财产保险公司的共同特征或相异之处也就显得尤为重要。为了找出构成财产保险公司基本特征的各变量之间的内在联系以及找出各财产保险公司的共同特征或相异之处,我们需要分析一下几个方面:1、研究保费收入合计、赔款支出合计和公司总人数三变量之
2、间的简单相关关系。2、在控制“保费收入合计”前提下,对企业财产保险保费收入、机动车辆保险保费收入、货物运输保险保费收入、责任保险保费收入、信用保证保险保费收入、农业保险保费收入、短期健康保险保费收入、意外伤害保险保费收入、其他保险保费收入9 项保费收入进行偏相关分析。3、以赔款支出合计为因变量,以男、女、博士、硕士、学士、大专、中专以下、高级、中级、初级、三十五岁以下、三十六岁到四十五岁、四十六岁以上为自变量,进行多元线性回归。4、分析构成保费收入的 9 个变量的共同特征(提取公因子)。5、使用构成赔款支出的 9 个变量对各个财产保险公司进行 K均值聚类。针对上述分析的目的,在此主要采用以下几
3、种方法:、双变量相关性分析偏相关分析多元线性回归分析因子分析K-均值聚类分析具体分析流程如下:(一)先对研究保费收入合计、赔款支出合计和公司总人数三变量进行双变量相关性分析,来尝试找出变量之间的简单相关关系。在进行相关回归之前,先做散点图,来初步确定变量之间是否存在相关趋势。散点图的结果如下所示:从散点图中可以看出,这三个变量两两之间都存在着线性相关关系。之后再对这三个变量进行双变量相关性分析,得出的结果如下所示:描述性统计量均值 标准差 N保费收入合计 5320.9700 14326.08458 42赔款支出合计 2531.6662 7537.64279 42总人数 7497.17 1537
4、7.928 42相关性保费收入合计 赔款支出合计 总人数Pearson 相关性 1 .992* .796*显著性(双侧) .000 .000保费收入合计N 42 42 42Pearson 相关性 .992* 1 .796*显著性(双侧) .000 .000赔款支出合计N 42 42 42Pearson 相关性 .796* .796* 1显著性(双侧) .000 .000总人数N 42 42 42*. 在 .01 水平(双侧)上显著相关。从上表中可以看出来,三个变量的样本数都是 42,保费收入和赔款支出之间Pearson 相关系数为 0.992,即保费收入和赔款支出的相关系数为 0.992;保费
5、收入和总人数的 Pearson 相关系数为 0.796;赔款支出和总人数的 Pearson 相关系数也为 0.796。所以可以看出,保费收入合计、赔款支出合计和公司总人数三变量之间两两都存在着正相关关系。(二)在控制“保费收入合计”前提下,对企业财产保险保费收入、机动车辆保险保费收入、货物运输保险保费收入、责任保险保费收入、信用保证保险保费收入、农业保险保费收入、短期健康保险保费收入、意外伤害保险保费收入、其他保险保费收入9 项保费收入进行偏相关分析。得出的结果如下所示:描述性统计量均值 标准差 N企业财产保险保费收入 462.7786 1440.95382 42机动车辆保险保费收入 3619
6、.0548 10143.15242 42货物运输保险保费收入 155.0605 477.57431 42责任保险保费收入 170.1857 564.47409 42信用保证保险保费收入 86.9552 500.41069 42农业保险保费收入 123.9460 459.28324 42短期健康保险保费收入 54.5874 187.18149 42意外伤害保险保费收入 161.0490 362.75273 42其他保险保费收入 266.0288 821.42808 42保费收入合计 5320.9700 14326.08458 42相关性控制变量企业财产保险保费收入机动车辆保险保费收入货物运输保险
7、保费收入责任保险保费收入信用保证保险保费收入农业保险保费收入短期健康保险保费收入意外伤害保险保费收入其他保险保费收入相关性 1.000 .257 .870 .585 -.131 -.236 -.159 .161 .853显著性(双侧). .104 .000 .000 .413 .138 .320 .314 .000企业财产保险保费收入df 0 39 39 39 39 39 39 39 39相关性 .257 1.000 .163 .179 -.256 .172 .303 .353 .199保费收入合计机动车辆保险保费收入显著性(双侧).104 . .309 .264 .106 .282 .054
8、 .023 .212df 39 0 39 39 39 39 39 39 39相关性 .870 .163 1.000 .682 -.112 -.130 -.181 -.001 .784显著性(双侧).000 .309 . .000 .485 .419 .258 .994 .000货物运输保险保费收入df 39 39 0 39 39 39 39 39 39相关性 .585 .179 .682 1.000 -.066 .214 .170 -.372 .414显著性(双侧).000 .264 .000 . .682 .179 .288 .017 .007责任保险保费收入df 39 39 39 0 39
9、 39 39 39 39相关性 -.131 -.256 -.112 -.066 1.000 -.034 -.037 -.191 -.115显著性(双侧).413 .106 .485 .682 . .834 .818 .231 .475信用保证保险保费收入df 39 39 39 39 0 39 39 39 39相关性 -.236 .172 -.130 .214 -.034 1.000 .324 -.428 -.290显著性(双侧).138 .282 .419 .179 .834 . .039 .005 .066农业保险保费收入df 39 39 39 39 39 0 39 39 39相关性 -.1
10、59 .303 -.181 .170 -.037 .324 1.000 -.148 -.089显著性(双侧).320 .054 .258 .288 .818 .039 . .356 .581短期健康保险保费收入df 39 39 39 39 39 39 0 39 39相关性 .161 .353 -.001 -.372 -.191 -.428 -.148 1.000 .283显著性(双侧).314 .023 .994 .017 .231 .005 .356 . .073意外伤害保险保费收入df 39 39 39 39 39 39 39 0 39相关性 .853 .199 .784 .414 -.1
11、15 -.290 -.089 .283 1.000显著性(双侧).000 .212 .000 .007 .475 .066 .581 .073 .其他保险保费收入df 39 39 39 39 39 39 39 39 0从上表中可以看出:企业财产保险保费收入对于机动车辆保险保费收入、货物运输保险保费收入、责任保险保费收入、信用保证保险保费收入、农业保险保费收入、短期健康保险保费收入、意外伤害保险保费收入、其他保险保费收入的相关性依次为0.257、0.870、0.585、-0.131 、-0.236 、-0.159、0.161、 0.853。可以看出,企业财产保险保费收入相对于货物运输保险保费收入
12、、责任保险保费收入、其他保险保费收入的相关性比较大,呈现正相关,而与其他的因素相关性不太明显。机动车辆保险保费收入对于货物运输保险保费收入、责任保险保费收入、信用保证保险保费收入、农业保险保费收入、短期健康保险保费收入、意外伤害保险保费收入、其他保险保费收入的相关性依次为 0.163、0.179、-0.256、0.172、0.303、0.353、0.199。可以看出,机动车辆保险保费收入对于各个因素之间的相关性都不是特别高。货物运输保险保费收入对于责任保险保费收入、信用保证保险保费收入、农业保险保费收入、短期健康保险保费收入、意外伤害保险保费收入、其他保险保费收入的相关性依次为 0.682、-
13、0.112 、-0.130 、-0.181、-0.001 、0.784.可以看出货物运输保险保费收入对于责任保险保费收入、其他保险保费收入的相关性比较大,呈现正相关的趋势,而对于其他的因素相关性不太明显。责任保险保费收入对于信用保证保险保费收入、农业保险保费收入、短期健康保险保费收入、意外伤害保险保费收入、其他保险保费收入的相关性依次为-0.066、0.214、0.170、-0.372 、0.414。可以看出责任保险保费收入对于其他保险保费收入呈现正相关态势,与意外伤害保险保费收入呈现负相关态势,而对于其他的因素相关性不太明显。信用保证保险保费收入对于农业保险保费收入、短期健康保险保费收入、意
14、外伤害保险保费收入、其他保险保费收入的相关性依次为-0.034、-.037、-0.191 、-0.115。可以看出信用保证保险保费收入对于其他的因素都呈现负相关关系,然而相关性并不明显。农业保险保费收入对于短期健康保险保费收入、意外伤害保险保费收入、其他保险保费收入的相关性依次为 0.324、-0.428 、-、.290。可以看出农业保险保费收入对于短期健康保险保费收入呈现正相关,对于意外伤害保险保费收入、其他保险保费收入呈现负相关。短期健康保险保费收入对于意外伤害保险保费收入、其他保险保费收入的相关性依次为-0.148 、 -0.089,可以看出相关性并不明显。意外伤害保险保费收入对于其他保
15、险保费收入的相关性系数为 0.283,相关性并不明显。(三)以赔款支出合计为因变量,以男、女、博士、硕士、学士、大专、中专以下、高级、中级、初级、三十五岁以下、三十六岁到四十五岁、四十六岁以上为自变量,进行多元线性回归。得出的结果如下所示:输入移去的变量 a模型 输入的变量 移去的变量 方法1 中级 . 步进(准则: F-to-enter 的概率 = .100)。2 中专以下 . 步进(准则: F-to-enter 的概率 = .100)。3 博士 . 步进(准则: F-to-enter 的概率 = .100)。4 初级 . 步进(准则: F-to-enter 的概率 = .100)。a. 因
16、变量: 赔款支出合计模型汇总 e模型 R R 方 调整 R 方标准 估计的误差 Durbin-Watson1 .985a .971 .970 1303.029302 .990b .980 .979 1081.735953 .996c .992 .991 696.681014 .997d .994 .993 608.45217 2.968模型汇总 e模型 R R 方 调整 R 方标准 估计的误差 Durbin-Watson1 .985a .971 .970 1303.029302 .990b .980 .979 1081.735953 .996c .992 .991 696.681014 .99
17、7d .994 .993 608.45217 2.968a. 预测变量: (常量), 中级。b. 预测变量: (常量), 中级, 中专以下。c. 预测变量: (常量), 中级, 中专以下, 博士。d. 预测变量: (常量), 中级, 中专以下, 博士, 初级。e. 因变量: 赔款支出合计Anovae模型 平方和 df 均方 F Sig.回归 2.262E9 1 2.262E9 1331.976 .000a残差 67915414.156 40 1697885.3541总计 2.329E9 41回归 2.284E9 2 1.142E9 975.865 .000b残差 45635953.637 39
18、 1170152.6572总计 2.329E9 41回归 2.311E9 3 7.703E8 1587.134 .000c残差 18443848.313 38 485364.4293总计 2.329E9 41回归 2.316E9 4 5.789E8 1563.798 .000d残差 13697919.680 37 370214.0454总计 2.329E9 41a. 预测变量: (常量), 中级。b. 预测变量: (常量), 中级, 中专以下。c. 预测变量: (常量), 中级, 中专以下, 博士。d. 预测变量: (常量), 中级, 中专以下, 博士, 初级。e. 因变量: 赔款支出合计系数
19、 a非标准化系数 标准系数模型 B 标准 误差 试用版 t Sig.(常量) 126.112 211.590 .596 .5551中级 2.837 .078 .985 36.496 .000(常量) -147.941 186.546 -.793 .4332中级 2.522 .097 .876 26.043 .000中专以下 .322 .074 .147 4.363 .000(常量) 145.512 126.378 1.151 .257中级 2.747 .069 .954 39.672 .000中专以下 .428 .050 .195 8.641 .0003博士 -111.543 14.902 -
20、.161 -7.485 .000(常量) 83.429 111.727 .747 .460中级 2.958 .084 1.027 35.026 .000中专以下 .571 .059 .260 9.706 .000博士 -116.959 13.103 -.169 -8.926 .0004初级 -.249 .070 -.132 -3.580 .001a. 因变量: 赔款支出合计从上表中可以看出,只有剩下中级、中专以下、博士、初级这些因素,所以这些变量与因变量之间都存在着线性关系。而从系数表中可以看出来,中级与与因变量赔款支出合计之间存在正相关关系;中级和中专以下两者与因变量之间存在负相关关系;中级
21、、中专以下、博士三者与因变量存在正相关关系;中级、中专以下、博士、初级四者与因变量存在正相关关系。(四)分析构成保费收入的 9 个变量的共同特征此处采用因子分析,得出的结果如下所示:KMO 和 Bartlett 的检验取样足够度的 Kaiser-Meyer-Olkin 度量。 .899近似卡方 826.895df 36Bartlett 的球形度检验Sig. .000公因子方差初始 提取企业财产保险保费收入 1.000 .977机动车辆保险保费收入 1.000 .985货物运输保险保费收入 1.000 .965责任保险保费收入 1.000 .965信用保证保险保费收入 1.000 1.000农业
22、保险保费收入 1.000 .759短期健康保险保费收入 1.000 .889意外伤害保险保费收入 1.000 .900其他保险保费收入 1.000 .962提取方法:主成份分析。解释的总方差初始特征值 提取平方和载入 旋转平方和载入成份 合计 方差的 % 累积 % 合计 方差的 % 累积 % 合计 方差的 % 累积 %1 7.401 82.235 82.235 7.401 82.235 82.235 7.400 82.228 82.2282 1.001 11.125 93.360 1.001 11.125 93.360 1.002 11.132 93.3603 .328 3.646 97.00
23、64 .131 1.459 98.4655 .094 1.044 99.5096 .022 .250 99.7597 .010 .114 99.8728 .007 .077 99.9509 .005 .050 100.000提取方法:主成份分析。旋转成份矩阵 a成份1 2企业财产保险保费收入 .988 .008机动车辆保险保费收入 .992 .003货物运输保险保费收入 .983 .007责任保险保费收入 .982 .021信用保证保险保费收入 .008 1.000农业保险保费收入 .871 .021短期健康保险保费收入 .942 .024意外伤害保险保费收入 .948 -.028其他保险保费
24、收入 .981 .005提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。a. 旋转在 3 次迭代后收敛。从上述表中可以看出,KMO 指标为 0.899,明显0.7,所以适宜做因子分析,而特征值 Sig.为 0.0000.001 也证实了适合进行做因子分析。公因子表中,各个指标的提取率都比较高,解释的总方差表中可以看出,只有前两个成分的特征值大于 1,且这两个成分的累计贡献率为 93.36%,所以可以提取出 2 个因子,从碎石图中也可证这个结果。最后看旋转成分矩阵,可以提出两个因子。因子 1 中只有信用保证保险保费收入的值较小,可以命名为无关信用因子;因子 2 中只有信用
25、保证保险保费收入的值较高,可以命名为信用因子。(五)使用构成赔款支出的 9 个变量对各个财产保险公司进行 K均值聚类。得出的结果如下所示:初始聚类中心聚类1 2 3 4企业财产保险赔款支出 5292.42 .00 218.85 453.52机动车辆保险赔款支出 32262.65 .00 3809.56 10440.42货物运输保险赔款支出 1220.28 .00 38.06 63.17责任保险赔款支出 1589.81 .00 40.78 157.59信用保证保险赔款支出 680.69 846.35 .00 3.42农业保险赔款支出 864.91 .00 3.02 695.53短期健康保险赔款支
26、出 971.83 .00 1.86 284.64意外伤害保险赔款支出 657.62 .00 149.36 300.48其他保险赔款支出 2690.53 .00 39.51 294.79迭代历史记录 a聚类中心内的更改迭代 1 2 3 41 .000 846.006 804.355 1751.6032 .000 .000 .000 .000a. 由于聚类中心内没有改动或改动较小而达到收敛。任何中心的最大绝对坐标更改为 .000。当前迭代为 2。初始中心间的最小距离为 3912.026。聚类成员案例号 聚类 距离1 1 .0002 2 179.9673 3 420.5914 2 1257.4565
27、 2 783.7516 2 846.0067 2 874.8548 4 1751.6039 4 1087.49210 4 750.02111 2 315.75912 3 804.35513 2 422.70814 2 752.16215 3 362.35616 2 112.22917 2 216.75618 3 849.15419 2 1027.94220 2 63.91221 2 196.01322 2 114.04723 2 316.08924 2 206.21225 2 150.26726 2 204.42327 2 193.86328 2 208.02329 2 212.00830 2
28、 212.99331 2 170.64132 2 205.93633 2 207.47034 2 205.24035 2 205.79236 2 204.86037 2 204.84738 2 182.08839 2 207.50640 2 208.01341 2 208.002聚类成员案例号 聚类 距离1 1 .0002 2 179.9673 3 420.5914 2 1257.4565 2 783.7516 2 846.0067 2 874.8548 4 1751.6039 4 1087.49210 4 750.02111 2 315.75912 3 804.35513 2 422.708
29、14 2 752.16215 3 362.35616 2 112.22917 2 216.75618 3 849.15419 2 1027.94220 2 63.91221 2 196.01322 2 114.04723 2 316.08924 2 206.21225 2 150.26726 2 204.42327 2 193.86328 2 208.02329 2 212.00830 2 212.99331 2 170.64132 2 205.93633 2 207.47034 2 205.24035 2 205.79236 2 204.86037 2 204.84738 2 182.088
30、39 2 207.50640 2 208.01341 2 208.00242 2 208.028最终聚类中心聚类1 2 3 4企业财产保险赔款支出 5292.42 32.92 144.04 1044.31机动车辆保险赔款支出 32262.65 198.00 3010.25 8866.85货物运输保险赔款支出 1220.28 16.83 25.01 195.94责任保险赔款支出 1589.81 16.20 40.21 204.16信用保证保险赔款支出 680.69 25.91 5.96 40.54农业保险赔款支出 864.91 33.62 1.38 234.95短期健康保险赔款支出 971.83
31、 2.53 34.57 206.84意外伤害保险赔款支出 657.62 11.63 114.66 312.01其他保险赔款支出 2690.53 22.45 42.34 353.68最终聚类中心间的距离聚类 1 2 3 41 32700.518 29923.668 23986.4802 32700.518 2816.948 8747.6713 29923.668 2816.948 5948.7584 23986.480 8747.671 5948.758ANOVA聚类 误差均方 df 均方 df F Sig.企业财产保险赔款支出 9654164.733 3 17039.304 38 566.58
32、2 .000机动车辆保险赔款支出 3.903E8 3 254480.665 38 1533.597 .000货物运输保险赔款支出 489976.785 3 1797.910 38 272.526 .000责任保险赔款支出 821918.429 3 3985.567 38 206.224 .000信用保证保险赔款支出 140616.689 3 18329.344 38 7.672 .000农业保险赔款支出 258719.674 3 37395.856 38 6.918 .001短期健康保险赔款支出 333075.622 3 2112.668 38 157.656 .000意外伤害保险赔款支出 2
33、13022.855 3 1789.882 38 119.015 .000其他保险赔款支出 2372031.869 3 7314.562 38 324.289 .000F 检验应仅用于描述性目的,因为选中的聚类将被用来最大化不同聚类中的案例间的差别。观测到的显著性水平并未据此进行更正,因此无法将其解释为是对聚类均值相等这一假设的检验。每个聚类中的案例数1 1.0002 34.0003 4.000聚类4 3.000有效 42.000每个聚类中的案例数聚类 1 1.0002 34.0003 4.0004 3.000有效 42.000缺失 .000所以最后看出,总共聚出了 4 类,第 1 类为人保保险;第 2 类为机构2、4、5、6、7、11、13、14、16、17、19-42;第 3 类为保险机构 3、12、15、18;第4 类为保险机构 8、9、10。并且 ANOVA 表中显示,特征值 Sig.小于等于 0.001,所以结果显著。综上所示,我认为通过对我国各个财产保险公司的基本情况进行各种分析,可以看出构成财产保险公司基本特征的各变量之间大多存在线性相关关系,各财产保险公司之间构成保费的公共因子为无关信用因子以及信用因子;构成赔款支出的 9 个变量对各个财产保险公司聚成了 4 类。