收藏 分享(赏)

正态性检验的几种常用的方法_周洪伟.pdf

上传人:weiwoduzun 文档编号:4383728 上传时间:2018-12-26 格式:PDF 页数:6 大小:668.46KB
下载 相关 举报
正态性检验的几种常用的方法_周洪伟.pdf_第1页
第1页 / 共6页
正态性检验的几种常用的方法_周洪伟.pdf_第2页
第2页 / 共6页
正态性检验的几种常用的方法_周洪伟.pdf_第3页
第3页 / 共6页
正态性检验的几种常用的方法_周洪伟.pdf_第4页
第4页 / 共6页
正态性检验的几种常用的方法_周洪伟.pdf_第5页
第5页 / 共6页
点击查看更多>>
资源描述

1、收稿日期 : 2011-10-08 修回日期 : 2012-03-20作者简介 : 周洪伟 ( 1978 ) , 男 , 江苏南京人 , 硕士 , 讲师 , 研究方向 : 概率统计 , 金融数学 , 复杂网络 Email: hwzhou122yahoo com cn2012 年 5 月第 3 期南京晓庄学院学报JOURNAL OF NANJING XIAOZHUANG UNIVERSITYMay, 2012No 3正态性检验的几种常用的方法周洪伟( 南京晓庄学院 数学与信息技术学院 , 江苏 南京 210017)摘 要 : 正态分布是自然界中一种最常见的也是最重要的一种分布 因此 , 人们在实

2、际使用统计分析时 , 总是乐于正态假定 , 但该假定是否成立 , 牵涉到正态性检验 在一般性的概率统计教科书中 , 只是把这个问题放在一般性的分布拟合下作简短处理 , 而这种 “万精油 ”式的检验方法 , 对正态性检验不具有特效 鉴于此 , 该文从不同角度出发介绍正态性检验的几种常见的方法 , 并且就各种方法作了优劣比较 , 希望能对正态性检验感兴趣的实用和理论研究人员起到一定的参考与借鉴作用 关键词 : 正态分布 ; 检验 ; 方法 ; 应用中图分类号 : O212 文献标识码 : A 文章编号 : 1009-7902( 2012) 03-0013-060 引言正态分布是自然界中一种最常见和

3、最重要的一种分布 以正态总体为前提的统计方法也已经被越来越多的教学 、科研工作者所掌握 但是 , 在一个实际问题中 , 总体一定是正态总体吗 ? 如果不顾这个前提是否成立 , 盲目套用公式 , 可能影响统计方法的效果 , 因此 , 正态性检验是统计方法应用中的重要问题 但一般的数理统计教材中 , 关于正态性检验方法只介绍 2拟合优度检验 , 但该方法不仅对正态分布且对其他分布也适用 , 对正态性检验不具有特效 本文在查阅了该问题的大量文献的基础上 , 结合正态分布的特点介绍了几种常见的正态性检验方法 , 并对各种方法的优劣点作了简要介绍 本文的结构安排如下 , 第一部分介绍了正态分布的一些基本

4、知识 , 第二部分首先介绍定性的正态性检验 : 利用概率纸检验 , 其次简要介绍 2拟合优度检验 ; 再次介绍了正态性检验的特效方法 : W 检验与 D 检验 , 最后介绍有方向性的正态性检验 : 峰度检验与偏度检验 第三部分简要地比较了各种检验法的优劣性 1 正态分布的基本知识1 1 正态分布的概念定义 1 若随机变量 X 的密度函数为f( x) =1 2槡e( x ) 222, x( , + ) ( 1)其中 和 为参数 , 且 ( , + ) , 0则称 X 服从参数为 和 的正态分布 , 记为 X N( , 2) 另我们称 =0, =1 的正态分布为标准正态分布 , 记为 X N( 0

5、, 1) , 标准正态分布随机变量的密度函数和分布函数分别用 ( x) 和 ( x) 表示 引理 1 若 , X N( , 2) , F( x) 为 X 的分布函数 , 则 F( x) =x ( )( 2)由引理可知 , 任何正态分布都可以通过标准正态分布表示 311 2 正态分布的数字特征引理 2 若 X N( , 2) , 则 E( X) =, D( X) =2( 3)引理 3 若 X N( , 2) , 则X 的 n 阶中心矩为 n=0, n =2k +1( 2k 1) ! ! 2k, n =2k( kN) ( 4)为了刻画各种分布的密度函数曲线的形状 , 我们引入偏度和峰度的概念 定义

6、 2 把三阶中心矩除以标准差 的立方得到的标准化的三阶中心矩称为随机变量的偏度 , 记为 s,即 s=33( 5)定义 3 把四阶中心矩除以方差的平方得到的标准化的四阶中心矩称为随机变量的峰度 , 记为 k, 即k=44( 6)引理 4 若 X N( , 2) , 则 s=0, k=3 ( 7)定义 4 若随机变量的分布函数 F( x) 可表示为 :F( x) = ( 1 ) F1( x) +F2( x) ( 0 1) ( 8)其中 F1( x) 为正态分布 N( , 21) 的分布函数 , F2( x) 为正态分布 N( , 22) 的分布函数 , 则称 X 的分布为混合正态分布 引理 5

7、混合正态分布的峰度 k3注 : 引理 1、2、3、4 的证明见参考文献 1 和 2, 引理 5 的证明见参考文献 7 2 几种常见的正态性检验方法2 1 利用概率纸检验分布的正态性2 1 1 正态概率纸的构造正态概率纸是一种具有特殊刻度的坐标纸 , 它能使由正态变量的取值 x 和相应的分布函数值 F( x) 组成的数对 ( x, F( x) ) 在这张纸上呈一条直线 因此 , 它计算使用简单方便 关于利用概率纸检验分布的正态性的原理 , 由于篇幅有限 , 不便阐述 , 见参考文献 2 下面重点介绍利用概率纸检验总体正态性假设的一般步骤 :1) 把从总体中获得的 n 个样本观测值按由小到大的次序

8、排列成 : x( 1)x( 2)x( n)2) 将数 x( i),i 3/8n +1/( )4( i =1, 2, , n) 画在正态概率纸上表 1 断裂时间表kk 3/8n +1/4x( k)lg( 10x( k)1 0041 0200 03012 0107 0330 05193 0172 0445 06484 0238 0490 06905 0303 0780 08926 0369 0920 09647 0434 0950 09788 0500 0970 09879 0566 1040 101710 0631 1710 123311 0697 2220 134612 0762 2275 1

9、35713 0828 3650 156214 0893 7000 184515 0959 8800 19443) 观察这 n 个点的位置 , 进行判断 如果这些点明显地不成一条直线 , 则拒绝总体正态性的假设 ;如果各点离直线的偏差都不大 , 可以认为总体近似服从正态分布 这时可以凭直觉画一条直线 , 使它离各点的偏离程度尽可能的小 ,其中在纵轴刻度为 50 %附近各点离直线的偏差要优先照顾 , 使其尽可能的小 , 并且使直线两边的点数大致相等 另外 , 若发现有些点系统地偏离直线 , 在拒绝总体正态性假设后 , 可以考虑其他分布类型 特别地 , 如果几个较大的值明显地倾向于由其他值确定的直线

10、的下方 , 考虑函数变换 y = log( x) 或 y =槡x后 , 总体是否服从正态分布 同时 , 利用概率纸还可以估计正态分布的参数 和 虽然不够精确 , 但十分简便 2 1 2 正态概率纸法的应用例 1 对某种高温合金钢的 15 个试样在 580 的温度和15. 5 kg/mm2的压力下进行试验 , 其断裂时间为 t( 单位 : 小时 ) , 表411 给出了按由小到大的次序排列的 x( k),k 3/8n +1/4及对数变化下的值 lg( 10x( k) ( k =1, 2, , 15) , 试用正态概率纸法分析高温合金钢的寿命分布 解 将这 15 个结果值 x( k)分别同k 3/

11、8n +1/4和 lg( 10x( k) 组成点分别画在两张正态概率纸上 , 来检查这组结果值是否构成一条直线 , 是否服从正态分布 ( 见图 1) 图 1 的左图是由 x( k),k 3/8n +1/( )4所呈现的结果 , 可以看见这些点不成一条直线 图 1 的右图是由 ( x( k), lg( 10x( k) ) 所呈现的结果 , 可以看到这些点明显接近一条直线 , 所以说这些观测值的对数为正态分布的假设是适当的 图 1 正态概率纸 ( 参考文献 2)利用概率纸检验分布的正态性 , 靠的是人的视觉 , 主观性较强 , 所以检验的方法必须由定性的转为定量的 下面介绍几种定量的检验方法 2

12、2 2拟合优度检验当我们通过试验取得一系列数据后 , 经常会遇到这样一个问题 , 这些数据来自怎样的分布 ? 当然 , 可以根据已有数据画直方图 , 得到其分布的一个粗略的估计 但为了便于处理 , 我们希望能用一个公式定量地表示总体的概率函数 , 即选一个分布来拟合这批数据所属的总体 英国统计学家 K Pearson 引入了著名的 2拟合优度检验 一般的本科概率统计教材对 2拟合优度检验有详细介绍 , 鉴于篇幅限制 , 用 2拟合优度检验来检验总体的正态性的一般步骤见参考文献 1 以上的 2拟合优度检验法不仅适用于正态性检验 , 还适用于其他分布的检验 , 对正态性检验来说不具有特效型 , 下

13、面介绍两种只针对总体正态性假设的检验 : W 检验与 D检验 2 3 W 检验与 D 检验2 3 1 W 检验2 3 1 1 W 检验的一般步骤W 检验是 S S Shapiro 在 1965 年提出 , 检验的基本步骤如下 :1) 建立原假设 H0: X 服从正态分布 ;512) 把从总体中获得的 n 个样本观测值按由小到大的次序排列成 : x( 1)x( 2)x( n)3) 选择恰当的统计量 W 为 :W =n 2i =1ai( w) x( n+1i) x( i) 2ni =1 x( i) x2, 其中 n/2 表示 n/2 的整数部分 ; 系数 ai( W) 可查 W 检验的系数表 ,

14、n/2 表示数 n/2 的整数部分 4) 根据给定的检验水平 和样本容量 n 查 W 检验统计量 W 的 p 分位数得统计量 W 的 分位数 W5) 计算并判断 : 给定样本值 x1, , xn, 计算 W 并与 W 比较 , 若 W W, 则拒绝 H0, 反之 , 则不能拒绝H0注 : 有关 W 检验的原理及 W 检验的系数及分位数表见参考文献 5 表 2 患者血红蛋白差值表i x( i)x( 11 i)x( 11 i) x( i) ( W)1 12 37 49 057332 10 27 37 032913 06 20 26 021414 03 08 11 012245 0 07 07 00

15、3992 3 1 2 W 检验的应用例 2 抽查用克矽平治疗的矽肺患者 10 名 , 得他们治疗前后血红蛋白的差 ( 单位 : 克 %) 如下 : 2 7, 1 2, 1 0, 0, 0 7,2 0, 3 7, 0 6, 0 8, 0 3,试用 W 检验检验治疗前后血红蛋白的差是否服从正态分布 解 把例 2 中的数据按由小到大的次序排好填入表 2把表 2 的数据代入公式 W =n 2i =1ai( w) x( n +1 i) x( i) 2ni =1 x( i) x2, 经计算得 W =0. 9251若取 =0. 05, 查统计量 W 的 分位数表得 n =10 时 , W =0. 842,

16、因为 W W, 所以不拒绝原假设 虽然 W 检验是一种有效地正态性检验方法 , 但它一般只适用于容量为 3 至 50 的样本 , 随着 n 的增大 ,一般用于计算分位数的分布拟合的技术不能使用 2 3 2 D 检验1971 年 , D Agostino 提出了 D 检验 , 该检验不需要附系数表 , 另外 , 它适用于的样本容量 n 的范围为 :50n1000 D 检验的基本步骤如下 :1) 建立原假设 H0: X 服从正态分布 ;2) 把从总体中获得的 n 个样本观测值按由小到大的次序排列成 : x( 1)x( 2)x( n)3) 选择恰当的统计量 Y 为 :Y =槡n( D 0. 2820

17、9479)0. 02998598, 其中 D =ni =1i n + 1( )2x( i)(槡n)3ni =1 x( i) x槡24) 根据给定的检验水平 和样本容量 n 查 D 检验统计量 Y 的 p 分位数 , 得统计量 Y 的 /2 分位数 Y/2 和 1 /2 分位数 Y1 25) 计算并判断 : 给定样本值 x1, , xn计算 Y 并与 Y2及 Y1 2比较 , 若 Y Y2, 或 Y Y1 2则拒绝 H0, 反之 , 则不能拒绝 H0注 : 有关 D 检验的原理及 D 检验的分位数表见参考文献 6 以上两种检验需要提供分位数表及统计量的计算较为繁琐 , 下面介绍另外两种正态性检验

18、的方法 : 偏度检验与峰度检验 2 4 偏度检验与峰度检验2 4 1 偏度检验设 x1, , xn为来自总体 X 的一组样本 , 由引理 4 知 , 若 X 服从正态分布 , 则偏度为 0 若有一组数据 x1,61, xn, 观察发现数据有正偏度或负偏度的倾向 , 就在偏度方向产生了对正态性假设的怀疑 因此 , 把总体正态性检验转化成原假设 H0: s=0 的检验 偏度检验的一般步骤如下 :1) 根据实际问题中的先验信息建立原假设 H0:s=0 与备择假设 H0: s0, 或 H1: s02) 选择恰当的偏度统计量 bs为 : bs=槡nni =1( xi x)3ni =1 xi x 232(

19、 9)3) 根据给定的检验水平 和样本容量 n 查偏度统计量 bs的 p 分位数表 , 得统计量 bs的 1 分位数 bs( 1 )4) 计算并判断 : 给定样本值 x1, , xn, 计算 bs并与 bs( 1 ) 比较 , 作出判断 : 当备择假设为 H1: s0 时 , 若 bs bs( 1 ) 则拒绝 H0, 反之 , 则不能拒绝 H0; 当备择假设为 H1: s0 时 , 若 bs bs( 1 ) 则拒绝 H0, 反之 , 则不能拒绝 H0在进行偏度检验时 , 备择假设不同 , 判断的准则也不同 因而 “具有总体在偏度方向上偏离正态 , 并且有明确的偏度方向 ”是偏度检验的使用条件

20、2 4 2 峰度检验同理 , 设 x1, , xn为来自总体 X 的一组样本 , 由引理 4 知 , 若 X 服从正态分布 , 则峰度为 3 若由先验知识知总体在峰度方向上偏离正态 , 则可以把总体正态性检验转化成原假设 H0: k=3 的检验 2 4 2 1 峰度检验的一般步骤1) 根据先验信息 , 建立原假设 H0: k=3 与备择假设 H1: k3 或 H1: k32) 选择恰当的偏度统计量 bk为 : bk=nni =1( xi x)4ni =1 xi x 22( 10)3) 根据给定的检验水平 和样本容量 n 查偏度统计量 bk的 p 分位数表 , 得统计量 bk的 1 分位数 bk

21、( 1 ) 或 分位数 bk( ) 4) 计算并判断 : 给定样本值 x1, , xn, 计算 bk并与 bk( 1 ) , bk( ) 比较 , 作出判断 : 当备择假设为 H1: k3 时 , 若 bk bk( 1 ) 则拒绝 H0, 反之 , 则不能拒绝 H0 当备择假设为 H1: k3 时 , 若 bk bk( ) 则拒绝 H0, 反之 , 则不能拒绝 H0注 : 1) 在进行峰度检验时 , 备择假设不同 , 判断的准则也不同 因而 “具有总体在峰度方向上偏离正态 ,并且有明确的偏度方向 ”是偏度检验的使用条件 2) 有关偏度检验 、峰度检验的原理及统计量 bs、bk的 p 分位数表见

22、参考文献 7 2 4 2 2 峰度检验的应用例 3 某人怀疑测量过程受到干扰 , 因而又测量了 40 个同类零件的同一尺寸 , 测得与理论值的偏差见表 3表 3 测量偏差表0038 024 0124 0054 0061 0004 0006 0007 0004 00010061 0043 0035 0163 0008 001 0006 0008 0024 00070028 0108 0155 0159 0032 0003 0007 0018 0008 0011006 0067 0025 0096 0223 0004 0007 0007 001 0014试检验这批数据是否来自正态总体 解 如果测量

23、不受干扰 , 测量的偏差服从正态分布 N( , 21) , 对测量过程的干扰可能是均值相同 、方差增大的正态分布 N( , 22) ( 2221) 测量偏差服从混合正态分布 , 混合正态分布的定义见定义 4, 由引理5 知测量偏差的分布的峰度 k 3, 因此给出备择假设为 H1: k 3, 把表 3 的数据代入公式 ( 10) , 其中n =40; 经计算得 bk=4. 96, 取检验水平 =0. 05, 查 bk的 p 分位数表得 bk( 0. 95) =4. 06, 因为 4. 96 4. 06,71因而拒绝原假设 , 认为总体为峰度大于 3 的分布 3 结束语正态性检验是数理统计上一个极

24、富价值的课题 , 上述的各种正态性检验方法各自有其优劣处 概率纸检验法实施起来简便直观 , 但主观性较强 , 属于定性检验 ; 2拟合优度检验不仅能检验分布的正态性 , 也能检验总体是否服从其他分布 , 从这一点来说 , 它与前者具有通用性 , 但同时它们对正态性检验缺乏特效 , 效果并不十分理想 ; 而 W 检验与 D 检验只检验总体服从正态分布的特定方法 , 相对来说 , 效果比较理想 , 但各自使用的范围不一样 ; 偏度与峰度检验则是在有先验信息已知总体在偏度或峰度上有明确的偏离方向的情况下 , 来检验总体是否服从正态分布 , 称为有方向的检验 如果实际问题中不具备该信息 , 则无法使用

25、该方法来检验 因此 , 我们在使用以上方法进行正态性检验时一定要注意具体问题中所包含的信息 , 从中适宜的检验方法 参考文献 : 1 沈恒范 概率论与数理统计教程 M 北京 : 高等教育出版社 , 1998 2 陈希孺 数理统计学教程 M 上海 : 上海科技出版社 , 1988 3 陈希孺 数理统计引论 M 北京 : 科学出版社 , 1981 4 张里千 论柯尔莫哥洛夫统计量的真确分布及其渐渐展开 , 数学学报 J 1956, 6( 1) : 55-81 5 Shapiro S S An analysis of variance test for normality, Biometrika J

26、 1965( 52) : 591-611 6 Agostino D An omnibus test of normality for moderate and large size samples, Biometrika J 1971( 58) : 341-348 7 Bowman K O, Shenton L R Omnibus test for departures from normality based on b槡sand bk, Biometrika J 1975( 58) :243-250( 责任编辑 : 叶 玲 )Several Commonly Methods on Inspe

27、ction of Normal DistributionZHOU Hong-wei( School of Mathematics and Information Technology, Nanjing XiaoZhuang University, Nanjing 210017, Jiangsu)Abstract: It is well known that the normal distribution is one of the important distribution In statistical analysis,we usually suppose that the populat

28、ion submit to normal distribution But the hypothesis needs testing For this rea-son, the testing of normal distribution is significance In this paper, we introduce several commonly methods on in-spection of normal distribution We hope these methods can give some reference for the practical and theoretical re-searchers interested in this issueKey words: normal distribution; test; method; application81

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 经营企划

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报