1、1随机过程论文马氏链的应用学院:东凌经济管理学院班级:金融0902班姓名:游蕊学号:409791172一、 文献综述马氏链在日常生活诸多领域中有着广泛的应用。我引用了五篇文献,分别是刘家军的马氏链在无赔款优待模型中的应用;廖捷、陈功的叠加马尔科夫链模型在高原年降水量预测中的应用;郭小溪的借助于马尔柯夫链的无后效性性质, 预测2000 2005年6年的8项支出量;吴加荣、谢明铎、何穗的一类马氏链的数据仿真与应用;肖定文、黄崇起的用马尔柯夫过程预测股市短期或中长期走势。刘家军在2009年介绍了马氏链在无赔款优待模型中的应用, 利用mat lab7. 0 计算在未来几年中索赔事件发生的强度分布与被保
2、险人所处折扣等级的分布以及两者的极限分布, 并依此计算纯保费。降水量的预测是气象学中一项重要的研究工作。由于气象系统的复杂性、多样性,使得降水过程具有不确定性、较难精确预测的特点。廖捷、陈功2010年引入了叠加马尔科夫链模型,以位于川西高原的小金站1961-2010年的全年降水量资料为例,探讨了叠加马尔科夫链模型在高原年降水量预测中的应用。廖捷、陈功利用均值-均方差分级法对年降水量进行分级,并由此将小金站各年的全年降水量划分为5个状态。根据各年降水量的状态,可统计得到不同步长的概率转移矩阵。在进行降水量的叠加预测时,主要考虑利用步长为14的概率转移矩阵进行计算。首先利用19612000长度为4
3、0 年的降水量序列预测了2001年的降水量,之后去掉1961 年降水量值,加入2001 年实际观测降水量值,保持序列长度不变,预测2002年的降水3量。以此类推,利用叠加马尔科夫链模型预测了小金站20012010 共十年的降水量,并与该站实际观测降水量进行了对比。2006年郭小溪利用长春市居民1998、1999连续两年的收、支数量变化,借助于马尔柯夫链的无后效性性质, 建立居民消费性支出结构的概率转移矩阵, 进而预测出自2000年至2005年6年的8项支出值; 进一步分析居民消费性支出变化的基本规律和受控因素, 并与经济发展条件一起探讨发展经济的人文环境影响作用。吴加荣、谢明铎、何穗利2009
4、年利用马尔可夫链的几个重要定理, 研究了一颗粒在具有n个顶点的正多面体的顶点上运动的转移概率矩阵, 得到概率转移矩阵极限中的元素均为, 利用定理2求得该颗粒首次返回起跳点所需的平均步数为n,以及该颗粒在首次返回起跳点经过体对顶点的平均次数为1,最后针对一个正八面体,利用计算机随机生成数据进行模拟,得到的结果与定理相吻合的。最后应用该方法研究了生产结构优化的问题。肖定文、黄崇起1996年给出了用马尔柯夫过程预测股市短期或中长期走势的一种方法,对 K 线图理论、波浪理论、威尔德数量理论等其它技术分析方法作了有益的补充。二、理论推导、公式、结论1.马氏链在无赔款优待模型中的应用在概率空间(8 , F
5、, P) 中, A =1, 2, , n, T = 0, 1, 2, , Xt; tT 是表示t时刻被保险人所处状态的随机变量序列, 由于投保人在下一年的保费级别只取决于他在前一年的索赔记录, 所以4对任意的tE 1 及任意的C1, , CnA , 显然有 P X t = C t/X 1 = C1, , X t- 1 = C t- 1 = P X t= C t/X t- 1 = C t- 1记 p ij= PXt= i/Xt- 1= j, 显然对 i= 0, 1, 2, ,n, 则t时刻转移概率可以写为矩阵的形式: N t 称为转移概率矩阵。这样, 只要给定在t 时刻保费分布U t= (U t
6、1,U t2, ,U tn) , 即各保费组别的保单比例, 就可以求出t+ 1 时刻保费分布U t+ 1= U tN t= U 1N 1N t第t 年内被保险人的赔案Xt, t= 1, 2, , 为一随机变量, 为了模拟Xt, t= 1, 2, , 一般假设Xt , t= 1,2, , 相互独立且服从强度参数为常数K的泊松分布。保险公司可以根据自己的经营状况制定: 保费等级共六级100% ,90% , 80% , 70% , 60% , 50% , 即第t 年初被保险人所处等级状态为U t= (U t1,U t2, ,U t6) , 被保险人所处的初始等级状态为U 1= (U 11,U 12,
7、U 16)。被保险人第t年初索赔发生强度状态共3级,0. 2, 0.3, 0. 4 即第t 年初索赔发生 强度状态H t=(H t1, H t2, H t3) , 被保险人所处的初始强度状态为H1=(H11, H12, H13)。事件发生强度t+ 1为齐次可列马氏链, 转移强度为R。循环运算10 000次, 确保获得t时,H t,U t 的极限当输入U 1= (1,0, 0, 0, 0) , H1= (0, 0, 1) 时,在第二年初, 被保险人5的等级状态为U 2 =(0. 3297, 0. 6703, 0, 0, 0, 0) , 被保险人索赔发生强度状态H2= (0. 300, 0. 40
8、00, 0. 3000) 在第10000 年初被保险人的等级状态, 即等级状态的极限为U 10000= ( 0. 0148, 0. 0166, 0. 0245, 0. 0567,0. 1858, 0. 7017)。第10000 年初被保险人索赔发生强度状态为,即强度状态的极限为H10000= (0. 5135, 0. 2973, 0. 1892)。当输入U 1= (0, 1, 0. 3, 0, 0. 4, 0. 15, 0. 05) ,H1= (0, 4, 0. 3, 0. 3) R不变时, 同样可得U 10000= ( 0. 0148, 0. 0166, 0. 0245, 0. 0567,0
9、. 1858, 0. 7017) 而当R = 时, 对于任意初始状态, 都有U 10000= (0. 0208, 0. 0228, 0. 0312, 0. 0643, 0. 1906, 0. 6703)所以, 有以下结论: 在索赔强度为马氏链的无赔款优待模型中, 等级状态的极限分布可以由R 唯一决定, 与初始状态无关。【1】2.叠加马尔科夫链模型在高原年降水量预测中的应用叠加马尔科夫链模型预测的基本步骤可简要概括为:1) 计算序列均值 x 和均方差s ,建立序列值的分级标准;2) 根据已建立的序列值的分级标准,确定序列中各时刻所处的状态;3) 计算得到不同步长的马尔科夫链的状态转移矩阵;4)设
10、与待预测年份相距步长k 的年份所处状态为i,用各状态均值向量(m) a 和步长为k 的状态转移矩阵(k ) P 的第i 个行向量来叠加预测该年的年降水量值 , 即65) 对比预测值与实际观测值,评价预测效果。实例分析:小金站位于青藏高原东部,102.35E,31N,海拔高度约为2369 米,县境内属暖温带半干旱河谷气候类型,冬春寒冷干燥,夏秋温暖潮湿。小金地处大渡河上游,是典型的高山峡谷地带,不但具有丰富的水利资源,也是长江上游重要的生态和水源涵养区。对小金地区降水量的准确预测具有重要的现实意义。在本文中,利用均值-均方差分级法对年降水量进行分级。对于序列,其均值为 ,均方差为s , 在应用中
11、, 通常可将序列值划分为五级:其中, 一般可在1.0,1.5中取值, 一般可在0.3,0.6中取值。年降水量的预测:7在进行降水量的叠加预测时,主要考虑利用步长为14 的概率转移矩阵进行计算。转移矩阵(k ) P 的第i 行第 j 列元素表示由状态i 经k 步转移至状态j 的概率。可由表2 统计得到步长为14 的各概率转移矩阵如下:计算得状态均值向量(由各状态上下限值求均值得到,状态1 的下限和状态5 的上限分别取序列值的最小值和最大值)为:19972000 年分别经过41 步(年)状态转移即到达2001 年,为了求得2001 年的年降水量预测值,可根据19972000 年降水量所处状8态,分
12、别取出相应步长的状态转移矩阵的对应行向量,与均值向量(m) a 作内积即可得到该步长时的 2001 年的降水量预测值,将不同步长转移矩阵求得的预测值进行叠加平均,便可得到2001 年降水量的最终预测值,见表3。由表3 可知,利用叠加马尔科夫链模型预测的2001 年降水量为6399mm,与实际观测量 6795mm 相比较,误差为 -5.8%,可认为对2001 年年降水量的预测是较为接近真实情况的。在年降水量序列中,加入2001 年的实际观测值,同时去掉1961 年降水量值,保持序列长度为40 年,重复2.2 节中的各步骤,可得2002 年的年降水量预测值。以此类推,直至计算出2010 年的降水量
13、预测值。20012010 年降水量预测值及其与实际观测值的比较见表4。9分析表 4 中的数据可知,若将预测值与观测值的误差控制在10%以内的预测认为是“有效预测”,则对于小金站20012010 年降水量的预测的有效率为70%,其中预测误差在5%以内的年份占40%。预测误差较大的3 年分别为2004、2007 和2010 年,分析该三年的降水量可以发现,此三年均为大旱或大涝年,尤其是误差较大的2004 年,其降水量为小金站19612010 年观测记录资料中的极大年。由于叠加马尔科夫链模型在预测中涉及的因子为序列的均值、均方差、预测起始年份状态以及各类状态间转移的概率,若待预测年份降水量为大旱或大
14、涝,则模型预测将可能会有较大误差。但同时由于叠加马尔科夫链具有很强的“自我调整能力”,故其中某年的预测误差偏大并不会影响到后续年份的预测。研究结果表明,对于小金站20012010 年降水量的预测误差控制在10%以内的年份占70% ,其中预测误差控制在5%以内的年份占40%。预测误差较大的3 年分别为2004、2007 和2010 年,此三年均为大旱或大涝年。叠加马尔科10夫链模型预测以各种步长的马尔可夫链叠加来预测降水量状态,该方法与普通的马尔可夫链预测方法相比更能充分地利用信息。对于大旱或大涝年份降水量的预测,该预测模型存在着预测误差偏大的缺陷,有待在后续研究中进一步改进预测方法。叠加马尔科
15、夫链预测模型物理概念清晰,计算简便,为提高中短期降水量预测的精度提供了一条值得探索的途径。【2】3.借助于马尔柯夫链的无后效性性质, 预测 2000 2005 年 6 年的 8项支出量设时间序列预测模型y t = bt+ a, 折扣系数为 ( 0, 1), 用折扣法最小平法估计参数, 可得到参数b、a估计值的正态方程 11取a= 0.1, 从1993到1999年分别取t= - 3、- 2、- 1、0、1、2、3, 解( 1)得b、a, 所求直线预测模型为y t = 228 116.457 288t + 3 011 097.567 968, ( 2)再将2000至2005年的t= 4、5、6、7
16、、8、9代入( 2) 即可得到所预测的1999年之后6年长春市300户居民可支配收入的时间序列值(可支配收入), 如表2。居民消费性支出的马尔柯夫链预测:马尔柯夫链预测法最简单类型是将现有的统计资料和经济信息分成不同状态, 建立合理的概率转移矩阵, 再进行下期最可能状态的预测。在构造消费性支出的概率转移矩阵时, 遵从以下原则a 用各项支出占可支配收入的比率作为概率的近似;b 所有比率减少的项均向比率增加的项分配转移;c 所有比率增加的项均不向任何方向转移, 而以概率1向自身分配转移;d 比率分配计算:由以上原则以及表1数据, 可得到居民消费性支出结构的概率转移矩阵12以1999年的比率为始比率
17、, 由概率转移矩阵P (式( 3) ) 可以预测出2000 2005年居民的消费性支出结构的比率分配; 用S1、S2、S7 分别代表1999 2005年的消费性支出结构的比率分配向量, 用S0 代表1998年比率分配向量, 则有由表3和图2可见, 按支出增减分类可分为两大类, 第一类支出逐年减少项目和第二类支出逐年增多项目; 第一类包括食品、衣着、家庭耐用品和其他项目, 第二类包括医疗保健、交通和通讯、娱13乐教育文化用品和居住项目。在第一类项目中, 家庭耐用品支出下降幅度大, 5年内达到约0.6单位元( 1单位元设为106 元, 下同), 食品和衣着支出几乎都均匀下降, 而食品支出下降变化率
18、比衣着大。在第二类项目中, 交通和通讯项目增加幅度最大, 5年内达到约0.5单位元, 其次是娱乐教育文化用品、医疗保健和居住项目; 从增加变化率看,几乎4项支出都是均匀增加, 其中娱乐教育文化用品项目支出增加变化率最大, 约为0.16单位元/年, 居住项目最小, 约为0.05单位元/年; 娱乐教育文化用品、交通和通讯项目支出绝对量排第一与第二, 分别约1.46和0.9单位元。【3】4.一类马氏链的数据仿真与应用定义1 设X = xn (w), n = 0, 1, 2 是定义在概率空间( , F, P ) 上的随机变量序列, 其取值空间为I= N U 0, 记p ij ( n ) = P ( x
19、n+ 1 = j /xn = i) , 若对任意的n 0及I中的元i1, i2, i3, in - 1, i与j, 均有: P ( xn+ 1 = j /xn = i, xk = ik, k= 1, 2, n - 1) = P ( xn + 1 = j /xn = i) = p ij ( n )则称是一个离散时间的马尔可夫链, 简称马氏链。又称P = ( pij )为马氏链的一步转移矩阵; 称p(n) =(p( n )ij ) 为马氏链的n步转移概率, 而称P ( n) = (p( n)ij ) 为马氏链的n 步转移矩阵。14实例: 一个颗粒在正八面体的顶点上随机走动, 在每一步, 它以概率1
20、 /5留在原点, 分别以1 /5的概率移动到其它四个相邻的顶点。设0和5分别表示正八面体对角线上的两点。假设颗粒从0开始走动, 求:1) 该颗粒第一次回到 0 的平均步数。2) 该颗粒第一次回到0之前平均经过5的次数。解:八面体的各顶点标记如图1: 该颗粒的走动过程显然是一个马氏链, 易得, 其一步转移概率矩阵151) 显然该马氏链是不可约且非周期, 常返的, 由定理2可得limnp00 ( n) = 1 /u0 = 1 /6, 即: u1 = 62) 设p i ( tk tj ) 表示从i出发到达k 所需的步数小于从i出发到达j所需的步数的概率,P0 ( t5 t0 ) = ( 1 /5)0
21、+ ( 1 /5)p 1 ( t5 t0 ) + ( 1 /5) p2 ( t5 t0 ) +( 1 /5)p 3 ( t5 t0 ) + ( 1 /5) p4 ( t5 t0 ) = ( 4 /5) p1 ( t5 t0 )由对称性得: p 1 ( t5 t0 ) = 1 /2, p0 ( t5 t0 ) = 2 /5, p0 ( t5 t0 ) = 3 /5.设回访0之前经过5的次数是n,【4】5.用马尔柯夫过程预测股市短期或中长期走势根据深、沪两地股市的股价指数统计分析, 可以把股指划分为数个区间. 例如, 对深市而言可以把综合指数划分为:1 区: 100 点以下; 2 区: 100 点
22、至120 点间; 3 区: 120 点至140 点间; 即每隔20 点划分1 个区间1 据深市资料, 最高区间可划分16为360 380 点间.根据沪市历史资料以及本文实证分析的需要, 暂把沪市综合指数划分为3 个区间, 即低价区, 投机波动区, 高价区. 3 个区间的股指范围大致可以确定为: 1 低价区- 500 点以下; 1 投机波动区- 500 点 850 点; 1 高价区- 850 点以上.当然, 区间的划分还可以根据不同时期的阻力位和支撑位来划分, 也可以根据投资者的预测精度来划分.区间确定之后, 根据深沪两地历史资料, 统计得出概率转移矩阵P ij 表示今天(本周, 本月) 处于
23、i 区( i= 1, 2, , n) 而明天(下周, 下月) 处于 j ( j = 1, 2, , n) 区的可能性. 例如, 以月为单位, P 11= 0 表示本月处于低价区而下月仍处在低价区, 即股指连续两个月低于100点的概率为零. 换句话说, 深指在资料统计的历史期间, 不可能连续两个月都处在低价区. 如果12 个月当中, 有6 次连续两个月都处在120点至140点之间, 则可以认为 P 33= 6/12. 总之, P ij的数据可以根据历史资料给 出, 且有: 设 x 1 ( t) 表示第 t 天(周, 月) 股指处在1 区间的可能性, x 2 ( t) 表示第 t 天(周, 月)
24、处在2 区的可能性, x n ( t) 表示第 t 天17(周, 月) 处在 n 区的可能性. 一般地有x 1 ( t+ 1) = P 11x 1 ( t) + P 21x 2 ( t) + + P n1x n ( t)x 2 ( t+ 1) = P 12x 1 ( t) + P 22x 2 ( t) + + P n2x n ( t)x n ( t+ 1) = P 1nx 1 ( t) + P 2nx 2 ( t) + + P nnx n ( t)根据给定的初始条件X (0) ,向前迭代得出X ( t) = P tX (0)根据(1) 式可以预测股市的短期走势, (2) 式不但可以预测短期走势
25、, 还可以预测中长期走势. 在预测时, 我们给出以下定理.定理 无论股市初期 X (0) 所处的股指区间如何, 股市最终所处区间的可能性是相同的, 即【5】三、文献列表【1】 刘家军: 马氏链在无赔款优待模型中的应用(广东商学院数学与计算科学学院) 内蒙古科技与经济 第7期 2009 年4 月【2】吴加荣, 谢明铎, 何穗:一类马氏链的解及其数据仿真与应用 (华中师范大学数学与统计学院) 湖北师范学院学报(自然科学版) 第3期 2009【3】廖捷 陈功:叠加马尔科夫链在年降水量预测中的应用(中国气象局成都高原气象研究所,四川成都 610072)2010年18【4】郭小溪:用马尔柯夫链预测居民六年的消费性支出结构(吉林大学经济学院) 长春大学学报 第2期 2006【5】肖定文 黄崇起:股市预测的马尔柯夫过程模型(湖北大学经济学院) 湖北大学学报(自然科学版)第18卷第4期 1996 年12 月