1、复合泊松过程模型的推广和在 R 语言环境下的随机模拟0 引言对保险人而言,资产和负债是影响保险人稳定经营至关重要的因素。资产和负债的差额称为盈余,简记作:U(t)=A(t)L(t),t0其中 A(t)表示时刻 t 的资产,L(t)表示时刻 t 的负债, t=0 时刻的盈余被称为初始盈余,简记为 u,即 U(0)=u。对这个初步的理论模型进行简化并根据实际情况设置一些假定情况,会得出很多不同的盈余过程模型,最经典的有 Sparre Andersen 的古典盈余过程模型:U(t)=u+ctS(t);t0,u0,c0这是一个以 u 为初值,以时间 t 为指标集的随机过程。其中S(t),t0称为总理赔
2、过程,满足:S(t)=X1+X2+XN(t)0,N(t)0,N(t)=0N(t)表示0,t内的总理赔次数,Xi 表示0,t内第 i 次理赔的金额。根据这个古典盈余过程模型可以引出破产模型,在这个盈余过程模型中,一方面有连续不断的保费收入并以速度 c 进行积累,另一方面则是不断会有理赔需要支付,因此这是一个不断跳跃变化的过程。从保险人的角度来看,当然希望 ctS(t)恒大于0,否则就有可能出现 U(t)0其中保单到达时刻 M(t)服从参数为 1的泊松过程,理赔发生时刻 N(t)服从参数为2的泊松过程,每次支付的保险费 Xi 服从参数为 v 的相互独立的指数分布。在这个模型中,保险人期望 cM(t
3、)N(t)i=1Xi能恒大于 0,因此至少 E(cM(t)N(t)i=1Xi)0 即 c12/v,另外从经验来看,保险事故发生的概率一般不高,一次理赔的的金额应该远大于收到的保费,所以保单到达的速率应该远比理赔发生的速率大,否则这种产品就没有经营价值,保险人也将面临破产,所以 12 。考虑以下一个具体的破产模型案例:某一款保险产品,假设保单到达的速率为 1=10张/天,理赔发生的速率为 2=1次/天。假设每张保单价格 c=120,理赔额服从参数为 v=1/1000(以 c1=1.22/v设定)的指数分布。设定初始 u=3000 时,计算到第 1000 天为止发生破产的概率。本文用 R 语言模拟
4、了 10000 次,用时 1625 秒,大概不到半个小时的时间,时间还能接受。最终结果 10000 次中破产 5293 次,破产率大概 53%。输出各阶段破产时刻频数和频率结果如下:直方图为:由直方图可以非常明显地看出绝大部分破产时刻都在前 100 天,或者说从 0 开始的一小段时间内,在这之后的很长时间里,破产的频率急剧减少,可以认为破产的概率同样非常小。这对保险人来说,说明 3000 的初始盈余不够用,保险人需要准备更多准备金,才能抵抗初期的破产风险。2 第二个继续推广的破产模型在上一个破产模型中考虑了一款保险产品和对应理赔的问题,但现实中保险人往往同时经营着多种不同的保险产品,同样会有多
5、种对应的理赔问题。基于这个想法,考虑将上一个模型进一步推广,就得到了以下模型:U(t)=u+i=1N(t)ciMi(t)j=1Ni(t)i=1nXij,t0;u0;ci0将模型展开,可以表示为:U(t)=u+i=1N(t)ciMi(t)(j=1N1(t)X1j+j=1N2(t)X2j+j=1Nn(t)Xnj)这个模型考虑有 n 款不同的保险产品,保费分别用 ci 表示,第 i 款产品的保单到达时刻为Mi(t)。这样需要对应 n 款产品的理赔,假设第 i 款产品的理赔到达时刻为 Ni(t),对应的理赔额为 Xij,表示第 i 款产品第 j 次的理赔额。根据上一个模型的情况,这里假设 Mi(t)是
6、服从参数为 i 的泊松过程,Ni(t)是服从参数为 i 的泊松过程,Xij 是服从参数为 vi的指数分布。同样地,根据每个保单的对应情况,要求满足 ciii/vi 和 ii。考虑以下一个具体的破产模型案例:某保险人同时经营了三款不同的保险产品,假设保单到达的速率为 i=10 每一单位时间(简化起见,不考虑实际单位,改用形式的一单位时间),i=20,i=30。理赔发生的速率为 i=1,i=2,i=3。X1j 服从参数 v1=1/1000 的指数分布,假定v2=1/1500,v3=1/2000。以(20%预期收益率)的标准计算 ci 的值。c1=120,c2=180,c3=240。鉴于上个模型的模
7、拟经验,设置一个较大的初始盈余,初步设定 u=10 万。但是模拟结果发现破产率百分之一百,继续提高初始盈余,发现在把准备金提高到 100 万的情况下结果仍然全部破产,这充分说明破产概率主要不是由初始盈余决定的。在事故发生的概率,即理赔到达强度参数不可控的情况下,保险人可调整的参数剩下保费和理赔额服从指数分布的参数。首先通过同比例提高保费把预期收益率提高到 40%,在设定初始盈余 10 万的情况下尝试模拟 100 次,发现仍然全部破产,直到把预期收益率提高到 44%,破产率大概 75%;把预期收益率提高到 45%,破产概率大概 70%;直到把预期收益率锁定在 50%,100 次模拟结果破产率大概
8、 33%,正好三分之一,这是一个比较理想的分界点。100 次模拟时间 76.49 秒,时间稍长,如果模拟 1 万次,预计要花两个小时。暂时只模拟 1000 次来看下破产时刻的分布。1000 次模拟花时 845 秒,模拟结果破产概率 27.7%,破产时刻的分布如下:破产时刻分布的直方图如下:直方图显示大部分破产时刻都在前 200 时刻,直方图大致形状酷似“钟形”的右半边。由此可联想到如果提高初始盈余,可能在一定程度上降低破产概率的同时,会使破产时刻的直方图整体右移,左半边也可能呈钟形分布,使整体服从类似正态分布的形状。这里选取了初始盈余万,把预期收益率降到 45%,模拟 100 次结果破产概率
9、26%,与之前的结果接近。再选取初始盈余万,把预期收益率降到 40%,模拟 100 次结果破产概率 54%,验证了初始盈余和保费收入参数对破产比例的共同影响。两次结果的直方图如下:发现结果确实破产时刻整体右移,呈现钟形分布(第二幅图比较明显)。对于另外一个角度,在保持原始保费额不变的情况下,还可以调整理赔额服从指数分布的参数,同样在初始盈余万,在保费收入不变的条件下,调整三个指数分布的参数,使预期收益率为 30%,结果发现全未破产,说明调整指数分布的参数对破产率的影响效率跟保费不一样。把预期收益率调为 20%,破产率立刻上升到 81%,预期收益率为 25%时,破产率又下降到 18%,说明指数分
10、布的参数对破产率波动的影响非常剧烈。3 结论和建议文中提出的推广模型由于其随机性和复杂性,想求解精确的解析解非常困难,所以通过随机模拟的方式来求渐近解是一种可行的好方法。从文中两个模型的模拟结果来看,首先,提高初始准备金的额度是很重要的,能大大降低保险人在初期破产的风险;其次,保险费对破产概率有显著的影响,保险人在制定保费的时候通过精确的计算和大量的模拟,能得到合适的保费额;最后,因为理赔额参数的变动对破产概率的影响最为剧烈,所以通过高额回报增加承保业务的行为对保险人是非常危险的,应谨慎对待。4 模型的不足和其他有益探索本文的模型建立在很大的理想化程度上,而在现实中,并不完全精确的服从指定的分
11、布,所以将模型放到现实中应用的时候还需要进行改进和优化。另外本文只模拟了保单和理赔服从泊松过程的情况,还有可能是像带漂移的布朗运动那样更复杂的过程,理赔额也有可能服从对数正态分布、伽玛分布等情况,都没有做研究和讨论。还有一点,文中定义的破产跟现实的破产情况并不一致,现实情况要复杂的多,还受到其他更多因素的影响。对于随机模拟来说,按照一般估计精度的理论,要达到较高精度,往往需要增加的模拟次数会呈指数增长,意味着模拟时间的成本会非常大。所以,设计一个既能现实模型要求,又能减少模拟次数与运行时间的算法非常重要。本文第二个模型的模拟设计正是从这个基本出发来实现的,不过在应对大容量的保单和高精度的要求时,还需要对设计思路进行优化,减少循环和判断次数,减少计算机搜索路径等。我觉得从泊松过程等常用分布的优良性质出发找到一个简化的等价刻画形式是一个可行的方向。还有一点,随机模拟虽然都给出了定量的结果,但是都是离散的,而且中间间隔还很大。所以如果能通过大量模拟,取得破产概率关于保费收入和理赔支出的强度以及理赔支出额的多维样本数据,据此建立多元回归模型,可能会得到更多有益的结论,也能更好地应用于现实。