收藏 分享(赏)

正态性检验 方法简介.doc

上传人:精品资料 文档编号:11065410 上传时间:2020-02-06 格式:DOC 页数:16 大小:1.29MB
下载 相关 举报
正态性检验 方法简介.doc_第1页
第1页 / 共16页
正态性检验 方法简介.doc_第2页
第2页 / 共16页
正态性检验 方法简介.doc_第3页
第3页 / 共16页
正态性检验 方法简介.doc_第4页
第4页 / 共16页
正态性检验 方法简介.doc_第5页
第5页 / 共16页
点击查看更多>>
资源描述

1、正态性检验方法简介一、 Anderson-Darling 检验AndersonDarling 检验(简称 A-D 检验)是一种拟合检验,此检验是将样本数据的经验累积分布函数与假设数据呈正态分布时期望的分布进行比较,如果差异足够大,该检验将否定总体呈正态分布的原假设。样本数据的经验累积分布函数与理论累积分布函数之间的差异可通过两种分布之间的二次 AD 距离进行衡量,若二次 AD 距离小于置信水平下的临界值,则可认为样本数据来源于正态分布。Anderson-Darling 检验的计算步骤如下:1. 提出假设: ; 从从:0H 分 布不 从:0H;2. 计算统计量 ,其计算步骤为: 2A 首先将样本

2、数据按照从小到大的顺序进行排序并编号,排在第 位的数i据为 ;ix 其次进行样本数据的标准化,计算公式如下:(式 1-1)SxYii其中, 为所有样本数据的平均值, 为所有样本数据的标准x差。 接着计算 ,计算公式为)(iYF(式 1-2))(iiYF其中,其中 为标准正态分布函数,可查表获得。 最后 A2值,计算公式如下:(式 1-3))(1ln)(l)12( 1iNiNi YFY其中,N 为样本总个数, 为样本序号 3. 计算判定统计量 ,计算公式为:2A(式 1-4)25.7.01(2 NA4. 查找临界值:根据给定的显著性水平 ,查Anderson-Darling 临界值表,得到临界值

3、 ;2A5. 作出判定:若 ,则在 水平上,拒绝 ,即认为样本数据不服从 0H正态分布;若 ,则不能拒绝 ,即认为样本数据服从正态分布。20例 1. 采用 Anderson-Darling 判断表 1 中的数据是否符合正态分布。表 1 A-D 检测样本数据序号 数据 序号 数据 序号 数据1 8.14 18 10.38 35 9.62 2 8.30 19 10.38 36 9.72 3 8.44 20 10.43 37 9.74 4 8.45 21 10.48 38 9.78 5 8.62 22 10.50 39 9.92 6 8.77 23 10.56 40 9.94 7 8.82 24 1

4、0.58 41 9.98 8 8.82 25 10.69 42 9.99 9 8.90 26 10.77 43 10.02 10 8.97 27 10.80 44 10.04 11 9.01 28 11.25 45 10.06 12 9.28 29 11.44 46 10.16 13 9.34 30 11.68 47 10.22 14 9.41 31 11.84 48 10.32 15 9.44 32 12.04 49 10.36 16 9.51 33 12.12 50 10.37 17 9.54 34 12.51 检验步骤如下:1. 提出假设: ;从从:0H;分 布不:02. 计算统计量 ,

5、其计算步骤为: 2A 首先将样本数据按照从小到大的顺序进行排序并编号,排在第 位的数i据为 ,如表 2 中的第 2 列所示;ix 按照式 1-1 进行样本数据的标准化,如:, 823.1026.1481SxY 67.102.1382SxY其余依次类推,计算结果如表 2 中的第 3 列所示。 按照式 1-2 计算 ,如:)(iYF,034.8.1)()(1YF 048.)67.1()()(22YF其余依次类推,计算结果如表 2 中的第 4 列所示。 计算 和 ,如:)(lni )(liYF,376.04.1YF 035.)4.01ln()(1ln YF其余依次类推,计算结果如表 2 中的第 5

6、列和第 6 列所示。 计算 ,如:)(ln)(l 1iNiYF当 =1 时,i 281.)095.4(376.)(1ln)(l)(l)(l 501 YFYii当 =2 时,i 960.)1.3(4.)(1ln)(l)(ln)(l 4921YFYiNi其余依次类推,计算结果如表 2 中的第 7 列所示。 计算 ,如:)(l)(l12( 1iNii当 =1 时, 281.)(1ln)(l)(ln)()l( 501 YFYYFYi ii当 =2 时, 879.20)96.(3)(1ln)(l3)(ln)()l12( 4921 i iNi其余依次类推,计算结果如表 2 中的第 8 列所示。 最后计算

7、:2A392.0)612.59(15 )180.4(87.0.8ln)(l)1(502 iNii YFY表 2 A-D 检测计算过程表序号 i数据 ix标准化 iY)(iF)(lniY)(1liYF)(1ln)(l 1iNiYF)(1ln)()l2( 1iNiYFi1 8.14 -1.823 0.034 -3.376 -0.035 -8.281 -8.2812 8.30 -1.667 0.048 -3.041 -0.049 -6.960 -20.8793 8.44 -1.530 0.063 -2.765 -0.065 -6.497 -32.4874 8.45 -1.520 0.064 -2.7

8、46 -0.066 -6.036 -42.2535 8.62 -1.355 0.088 -2.433 -0.092 -5.394 -48.5446 8.77 -1.209 0.113 -2.177 -0.120 -4.681 -51.4967 8.82 -1.160 0.123 -2.095 -0.131 -4.272 -55.5348 8.82 -1.160 0.123 -2.095 -0.131 -3.606 -54.0949 8.90 -1.082 0.140 -1.969 -0.150 -3.441 -58.49310 8.97 -1.014 0.155 -1.862 -0.169 -

9、3.233 -61.43411 9.01 -0.975 0.165 -1.803 -0.180 -3.043 -63.90412 9.28 -0.712 0.238 -1.434 -0.272 -2.651 -60.98213 9.34 -0.653 0.257 -1.359 -0.297 -2.510 -62.74214 9.41 -0.585 0.279 -1.275 -0.328 -2.404 -64.90915 9.44 -0.556 0.289 -1.240 -0.341 -2.316 -67.16116 9.51 -0.487 0.313 -1.162 -0.375 -2.185

10、-67.74817 9.54 -0.458 0.323 -1.129 -0.391 -2.153 -71.03718 9.62 -0.380 0.352 -1.044 -0.434 -2.058 -72.03419 9.72 -0.283 0.389 -0.945 -0.492 -1.949 -72.10020 9.74 -0.263 0.396 -0.926 -0.505 -1.890 -73.71221 9.78 -0.224 0.411 -0.888 -0.530 -1.758 -72.09822 9.92 -0.088 0.465 -0.766 -0.626 -1.582 -68.04

11、023 9.94 -0.068 0.473 -0.749 -0.640 -1.482 -66.68424 9.98 -0.029 0.488 -0.717 -0.670 -1.434 -67.37525 9.99 -0.019 0.492 -0.709 -0.678 -1.410 -69.07926 10.02 0.010 0.504 -0.685 -0.701 -1.363 -69.51927 10.04 0.029 0.512 -0.670 -0.717 -1.340 -71.02928 10.06 0.049 0.519 -0.655 -0.733 -1.295 -71.23629 10

12、.16 0.146 0.558 -0.583 -0.817 -1.209 -68.90030 10.22 0.205 0.581 -0.543 -0.870 -1.073 -63.29031 10.32 0.302 0.619 -0.480 -0.964 -0.985 -60.06232 10.36 0.341 0.633 -0.456 -1.004 -0.949 -59.76833 10.37 0.351 0.637 -0.451 -1.014 -0.884 -57.49234 10.38 0.361 0.641 -0.445 -1.024 -0.836 -55.99635 10.38 0.

13、361 0.641 -0.445 -1.024 -0.820 -56.61236 10.43 0.409 0.659 -0.417 -1.075 -0.759 -53.867序号 i数据 ix标准化 iY)(iF)(lniY)(1liYF)(1ln)(l 1iNiYF)(1ln)()l2( 1iNiYFi37 10.48 0.458 0.677 -0.391 -1.129 -0.718 -52.43838 10.50 0.478 0.684 -0.380 -1.151 -0.677 -50.80339 10.56 0.536 0.704 -0.351 -1.218 -0.623 -47.989

14、40 10.58 0.556 0.711 -0.341 -1.240 -0.522 -41.20741 10.69 0.663 0.746 -0.293 -1.371 -0.462 -37.38542 10.77 0.741 0.771 -0.261 -1.472 -0.411 -34.11643 10.80 0.770 0.779 -0.249 -1.511 -0.381 -32.35244 11.25 1.209 0.887 -0.120 -2.177 -0.252 -21.89745 11.44 1.394 0.918 -0.085 -2.505 -0.206 -18.29846 11.

15、68 1.628 0.948 -0.053 -2.960 -0.145 -13.19747 11.84 1.784 0.963 -0.038 -3.290 -0.104 -9.70048 12.04 1.979 0.976 -0.024 -3.733 -0.089 -8.48149 12.12 2.057 0.980 -0.020 -3.919 -0.069 -6.69650 12.51 2.437 0.993 -0.007 -4.905 -0.042 -4.1803. 计算判定统计量 , 2A 398.0)52.07.1(392.0)5.27.01( N4. 查找临界值:根据给定的显著性水平

16、 =0.05,查附件中Anderson-Darling 临界值表,得到临界值 ;752.02A5. 作出判定:因为 ,则不能拒绝 ,即认为样本数据服从正态分2AH布。二、 Ryan-Joiner 检验此检验通过计算数据与数据的正态分值之间的相关性来评估正态性。如果相关系数接近 1,则总体就很有可能呈正态分布。Ryan-Joiner 统计量可以评估这种相关性的强度;如果它未达到适当的临界值,您将否定总体呈正态分布的原假设。此检验类似于 Shapiro-Wilk 正态性检验。Ryan-Joiner 检验的步骤为:1. 提出假设: ;从从:0H;分 布不:02. 计算相关系数 ,其计算步骤为: pR

17、 首先将样本数据按照从小到大的顺序进行排序,排在第 位的数据为 ;iix 其次进行样本数据的标准化,计算公式如下:(式 2-1)Sxbii其中, 为所有样本数据的平均值, 为所有样本数据的标准x差。 然后 值,计算公式如下:pR(式 2-2)NiiipbSxR1221)(其中,N 为样本总个数, 为样本序号 3. 查找临界值:根据给定的显著性水平 ,查Ryan-Joiner 检测临界值表,得到临界值 ;),(nRp4. 作出判定:若 ,则在 水平上,不能拒绝 ,即认为样本, 0H数据服从正态分布;若 ),(nRp,则拒绝 ,即认为样本数据不服0从正态分布。例 2. 采用 Ryan-Joiner

18、 方法判断表 3 中的数据是否符合正态分布。表 3 Ryan-Joiner 检测样本数据序号 数据 序号 数据 序号 数据1 8.14 18 10.38 35 9.62 2 8.30 19 10.38 36 9.72 3 8.44 20 10.43 37 9.74 4 8.45 21 10.48 38 9.78 5 8.62 22 10.50 39 9.92 6 8.77 23 10.56 40 9.94 7 8.82 24 10.58 41 9.98 8 8.82 25 10.69 42 9.99 9 8.90 26 10.77 43 10.02 10 8.97 27 10.80 44 10

19、.04 11 9.01 28 11.25 45 10.06 12 9.28 29 11.44 46 10.16 13 9.34 30 11.68 47 10.22 14 9.41 31 11.84 48 10.32 15 9.44 32 12.04 49 10.36 16 9.51 33 12.12 50 10.37 17 9.54 34 12.51 检测过程如下:1. 提出假设: ;从从:0H分 布不:0;2. 计算统计量 pR,其计算步骤为: 首先将样本数据按照从小到大的顺序进行排序并编号,排在第 i位的数据为 ix,如表 4 中的第 2 列所示; 按照式 2-1 进行样本数据的标准化,如

20、:, 823.1026.181Sxb 67.102.1382Sxb其余依次类推,计算结果如表 2 中的第 3 列所示。 计算 ,如:ix,86.14)823.1(4.81 b3.67.30.2x其余依次类推,计算结果如表 4 中的第 4 列所示。 计算 ,如:2ib,32.)8.1( 78.2)6.1(2b其余依次类推,计算结果如表 4 中的第 5 列所示。 计算 ,如:pR 987.046.51)937.78.23.()150(26.1 420)8.4)1(22 NiiipbSxR表 4 RyanJoiner 检测过程计算表序号 ixibibx2ib序号 ixibibx2ib1 8.14 -

21、1.823 -14.836 3.3222 8.30 -1.667 -13.833 2.7783 8.44 -1.530 -12.915 2.3424 8.45 -1.520 -12.848 2.3125 8.62 -1.355 -11.678 1.8356 8.77 -1.209 -10.599 1.4617 8.82 -1.160 -10.230 1.3458 8.82 -1.160 -10.230 1.3459 8.90 -1.082 -9.629 1.17010 8.97 -1.014 -9.092 1.02711 9.01 -0.975 -8.782 0.95012 9.28 -0.7

22、12 -6.603 0.50613 9.34 -0.653 -6.099 0.42614 9.41 -0.585 -5.503 0.34215 9.44 -0.556 -5.244 0.30916 9.51 -0.487 -4.635 0.23717 9.54 -0.458 -4.370 0.21018 9.62 -0.380 -3.657 0.14419 9.72 -0.283 -2.747 0.08020 9.74 -0.263 -2.563 0.06921 9.78 -0.224 -2.192 0.05022 9.92 -0.088 -0.870 0.00823 9.94 -0.068

23、-0.678 0.00524 9.98 -0.029 -0.292 0.00125 9.99 -0.019 -0.195 0.00026 10.02 0.010 0.098 0.00027 10.04 0.029 0.294 0.00128 10.06 0.049 0.490 0.00229 10.16 0.146 1.485 0.02130 10.22 0.205 2.092 0.04231 10.32 0.302 3.118 0.09132 10.36 0.341 3.534 0.11633 10.37 0.351 3.639 0.12334 10.38 0.361 3.743 0.130

24、35 10.38 0.361 3.743 0.13036 10.43 0.409 4.270 0.16837 10.48 0.458 4.801 0.21038 10.50 0.478 5.015 0.22839 10.56 0.536 5.661 0.28740 10.58 0.556 5.878 0.30941 10.69 0.663 7.085 0.439序号 ixibibx2ib42 10.77 0.741 7.978 0.54943 10.80 0.770 8.316 0.59344 11.25 1.209 13.596 1.46145 11.44 1.394 15.945 1.94

25、346 11.68 1.628 19.011 2.64947 11.84 1.784 21.118 3.18148 12.04 1.979 23.822 3.91549 12.12 2.057 24.925 4.22950 12.51 2.437 30.482 5.937合计 49.818 49.0315. 查找临界值:根据给定的显著性水平 =0.05,查Ryan-Joiner 检测临界值表,得到临界值 ;976.0)5.,(pR6. 作出判定:因为 ,则在 水平上,不能拒绝 ,即认为样,n 0H本数据服从正态分布。三、 K-S 检验K-S(KolmogorovSmirnov)检验是以两位苏联

26、数学家柯尔莫哥(Kolmogorov)和斯米诺夫(Smirnov)命名的。K-S 检验是一种拟合优度检验,研究样本观察值的分布和设定的理论分布间是否吻合,通过对两个分布差异的分析确定是否有理由认为样本的观察结果来自所设定的理论分布总体。设 是一个 n 次观察的随机样本观察值的累积概率分布函数,即经验分)(xFn布函数; 是一个特定的累积概率分布函数,即理论分布函数。定义0,显然若对每一个 x 值来说, 与 十分接近,也就是)(xDn )(xFn0差异很小,则表明经验分布函数与特定分布函数的拟合程度很高,有理由认为样本数据来自具有该理论分布的总体。K-S 检验主要考察的是绝对差数中那个最大的偏差

27、,即利用下面的统计量作出判断。)(0xFn(式 3-1))(max0xFDnK-S 检验的步骤为:1. 提出假设: ,)(:00xFHn)(:01xFHn2. 计算各个 D,找出统计量 max3. 查找临界值:根据给定的显著性水平 和样本数据个数 n,查单样本 K-S 检验临界值表可以得到临界值 D4. 作出判定:若 ,则在 水平上,拒绝 ,即认为样本数max),(nD0H据不服从正态分布;若 ,则不能拒绝 ,即认为样本数据ax),(服从正态分布。例 2:35 位健康男性在未进食前的血糖浓度如表所示,试测验这组数据是否来自正态分布:87, 77, 92, 68, 80, 78, 84, 77,

28、 81, 80, 80, 77, 92 ,86 ,76 ,80 ,81 ,75 ,77, 72 ,81, 72, 84 ,86, 80 ,68 ,77, 87, 76, 77, 78, 92, 75, 80, 78 解:检验过程如下:1. 首先计算样本均值和标准差,经计算样本均值 =79.7429,标准差=5.93763,故做出如下假设:H0:健康成人男性血糖浓度服均值为 79.7429,标准差为 5.93763 的正态分布;H1: 健康成人男性血糖浓度不服均值为 79.7429,标准差为 5.93763 的正态分布;2. 计算检验统计量 D 值表 5 K-S 检验中 D 统计量计算表血糖浓度

29、次数(f)累计次数(F)经验分布函数Fn(x)=F/n标准化值Z=(xu)/s理论分布函数F0(x)=(Z)Di=| F0(x)- Fn(x)|68 2 2 0.0571 -1.98 0.0240 0.0332 72 2 4 0.1143 -1.30 0.0961 0.0182 75 2 6 0.1714 -0.80 0.2122 0.0408 76 2 8 0.2286 -0.63 0.2642 0.0357 77 6 14 0.4000 -0.46 0.3221 0.0779 78 3 17 0.4857 -0.29 0.3846 0.1012 80 6 23 0.6571 0.04 0.

30、5173 0.1399 81 3 26 0.7429 0.21 0.5838 0.1590 84 2 28 0.8000 0.72 0.7633 0.0367 86 2 30 0.8571 1.05 0.8540 0.0031 87 2 32 0.9143 1.22 0.8892 0.0251 92 3 35 1.0000 2.06 0.9805 0.0195 首先将样本数据按照从小到大的顺序进行排列,并计算每个样本数据出现的次数 和累计次数 ,如表 5 中的第 1、2、3 列所示;fF 其次计算样本数据的经验分布函数 ,计算公式为: 。其)(xn nFx)(中 为样本数据的累计次数, 为样本

31、总数,如: ,F 0571.32)68(nF,其余依次类推,计算结果如表 5 中的第 4 列所示;143.05)72(n 然后进行样本数据的标准化,标准化计算公式为: ,其SxZ)(中 为所有样本数据的平均值, 为所有样本数据的标准差,如:x S1.985.93764286)8( xZ,3027)2(S其余依次类推,计算结果如表 5 中的第 5 列所示; 接着计算样本数据的理论分布函数 ,计算公式为:)(0xF,其中 为标准正态分布函数,可通 过查找正态分布)()0ZxF)(Z表获得,如:,0.28)9.1()68()(0 ZF,.13.72其余依次类推,计算结果如表 5 中的第 6 列所示;

32、 计算 K-S 的 D 统计量,计算公式为: ,例如:)()(0inii xFxD.32,68)()()(01101 nnFxFx , 0.18)7(2222 依次类推,计算结果如表 5 中的第 7 列所示。 最后找出统计量 0.19)max(iD3. 查找临界值:根据给定的显著性水平 和样本数据个数 n,查单样本 K-S检验临界值表可以得到临界值 。取 当 n=35 时,),(n,05.,24.0D4. 做出判定:由于 = 0.1590 ,所以,不能拒绝 ,即测试数据服从正maxD0H态分布。四、 关于 Johnson 转换中 Z 值选取的说明在 Johnson 转换中,需要根据正态性检验的

33、结果进行 Z 值的选取,根据所选取的正态性检验方法的不同,Z 值的选取方法也有所不同:(1)Anderson-Darling 检验若选用 Anderson-Darling 检验,则应计算转换后数据的 A2值和相应的值,从中选取最小的 A2 值,如果该 A2 值所对应的 小于 值, 则相应的2A 2Z 值即为最优的 Z 值,且所对应的转换形式就是最优的 Johnson 转换形式。若无法找到这样的 z 值,则说明样本数据不适合进行 Johnson 变换。(2)Ryan-Joiner 检验若选用 Ryan-Joiner 检验,则应计算转换后数据的 值, 从中选取最大的pR值,如果该 值大于临界值 ,

34、 则相应的 Z 值即为最优的 Z 值,且所pRpR),(nRp对应的转换形式就是最优的 Johnson 转换形式。若无法找到这样的 z 值,则说明样本数据不适合进行 Johnson 变换。(3)K-S 检验检验若选用 K-S 检验,则应计算转换后数据的 值, 从中选取最小的 值,maxDmaxD如果该 小于临界值 , 则相应的 Z 值即为最优的 Z 值,且所对应的转maxD),(nD换形式就是最优的 Johnson 转换形式。若无法找到这样的 z 值,则说明样本数据不适合进行 Johnson 变换。附表一:Anderson-Darling 临界值表0.1 0.05 0.025 0.01 0.0

35、052A0.631 0.752 0.873 1.035 1.159附表二:Ryan-Joiner 检验临界值表样本数 10.05.01.5 0.9026 0.8793 0.8266 0.9106 0.8886 0.83797 0.9177 0.8974 0.84978 0.924 0.9052 0.86059 0.9294 0.912 0.870110 0.934 0.9179 0.878611 0.9381 0.923 0.886112 0.9417 0.9276 0.892813 0.9449 0.9316 0.898714 0.9477 0.9352 0.90415 0.9503 0.9

36、384 0.908816 0.9526 0.9413 0.913217 0.9547 0.9439 0.917118 0.9566 0.9463 0.920719 0.9583 0.9484 0.92420 0.9599 0.9504 0.92721 0.9614 0.9523 0.929722 0.9627 0.954 0.9323样本数 10.05.01.23 0.964 0.9556 0.934724 0.9652 0.9571 0.936925 0.9663 0.9584 0.93926 0.9673 0.9597 0.940927 0.9683 0.9609 0.942728 0.9

37、692 0.962 0.944429 0.97 0.9631 0.94630 0.9708 0.9641 0.947531 0.9716 0.9651 0.948932 0.9723 0.966 0.950333 0.973 0.9668 0.951634 0.9736 0.9676 0.952835 0.9742 0.9684 0.953936 0.9748 0.9691 0.95537 0.9754 0.9698 0.95638 0.9759 0.9705 0.95739 0.9764 0.9711 0.95840 0.9769 0.9717 0.958941 0.9774 0.9723

38、0.959842 0.9778 0.9728 0.960643 0.9782 0.9734 0.961444 0.9786 0.9739 0.962145 0.979 0.9744 0.962946 0.9794 0.9748 0.963647 0.9798 0.9753 0.964248 0.9801 0.9757 0.964949 0.9805 0.9762 0.965550 0.9808 0.9766 0.966151 0.9811 0.977 0.966752 0.9814 0.9773 0.967353 0.9817 0.9777 0.967854 0.982 0.9781 0.96

39、8355 0.9823 0.9784 0.968856 0.9825 0.9787 0.969357 0.9828 0.9791 0.969858 0.9831 0.9794 0.970359 0.9833 0.9797 0.970760 0.9835 0.98 0.971161 0.9838 0.9802 0.971662 0.984 0.9805 0.97263 0.9842 0.9808 0.972464 0.9844 0.981 0.9728样本数 10.05.01.65 0.9846 0.9813 0.973166 0.9848 0.9815 0.973567 0.985 0.981

40、8 0.973868 0.9852 0.982 0.974269 0.9854 0.9822 0.974570 0.9856 0.9825 0.974871 0.9857 0.9827 0.975272 0.9859 0.9829 0.975573 0.9861 0.9831 0.975874 0.9862 0.9833 0.976175 0.9864 0.9835 0.976480 0.9871 0.9844 0.977790 0.9884 0.9859 0.9799100 0.9894 0.9872 0.9818200 0.9943 0.9931 0.9904300 0.996 0.9952 0.9934400 0.9969 0.9964 0.995600 0.9979 0.9975 0.9966800 0.9984 0.9981 0.99741000 0.9987 0.9985 0.99792000 0.9993 0.9992 0.9989附表三:单样本 K-S 检验临界表

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报