1、17第三章 正态分布一、教学大纲要求(一) 掌握内容1正态分布的概念和特征(1)正态分布的概念和两个参数;(2)正态曲线下面积分布规律。2标准正态分布标准正态分布的概念和标准化变换。3正态分布的应用(1)估计频数分布;(2)制定参考值范围。(二) 熟悉内容 标准正态分布表。(三) 了解内容 1利用正态分布进行质量控制2正态分布是许多统计方法的基础二、教学内容精要(一)正态分布1.正态分布 若 的密度函数(频率曲线)为正态函数(曲线)X(3-1)2()(1)(Xef 则称 服从正态分布,记号 。其中 、 是两个不确定常数,是正态分布的,N参数,不同的 、不同的 对应不同的正态分布。正态曲线呈钟型
2、,两头低,中间高,左右对称,曲线与横轴间的面积总等于 1。2正态分布的特征服从正态分布的变量的频数分布由 、 完全决定。(1) 是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以 为对称 x轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于 。(2) 描述正态分布资料数据分布的离散程度, 越大,数据分布越分散, 越小,数据分布越集中。 也称为是正态分布的形状参数, 越大,曲线越扁平,反之, 越小,曲线越瘦高。(二)标准正态分布1标准正态分布是一种特殊的正态分布,标准正态分布的 , ,通常用012(或 Z)表示服从标准正态分布的变量,记为 N(0 , ) 。u u21182标准
3、化变换: ,此变换有特性:若 服从正态分布 ,则 就服XuX),(2Nu从标准正态分布,故该变换被称为标准化变换。3. 标准正态分布表标准正态分布表中列出了标准正态曲线下从-到 范围内的面积比例 。u()(三)正态曲线下面积分布1实际工作中,正态曲线下横轴上一定区间的面积反映该区间的例数占总例数的百分比,或变量值落在该区间的概率(概率分布) 。不同 范围内正态曲线下的面积可用公式),(21X3-2 计算。(3-2)(2112)2()( udxeDXX 。 1uu其 中 , ,2.几个重要的面积比例轴与正态曲线之间的面积恒等于 1。正态曲线下,横轴区间 内的面积为X 68.27%,横轴区间 内的
4、面积为 90.00%,横轴区间 内的面积为 95.00%,64.96.1横轴区间 内的面积为 99.00%。58.2(四)正态分布的应用某些医学现象,如同质群体的身高、红细胞数、血红蛋白量,以及实验中的随机误差,呈现为正态或近似正态分布;有些指标(变量)虽服从偏态分布,但经数据转换后的新变量可服从正态或近似正态分布,可按正态分布规律处理。其中经对数转换后服从正态分布的指标,被称为服从对数正态分布。1. 估计频数分布 一个服从正态分布的变量只要知道其均数与标准差就可根据公式(3-2)估计任意取值 范围内频数比例。12(,)X2. 制定参考值范围(1)正态分布法 适用于服从正态(或近似正态)分布指
5、标以及可以通过转换后服从正态分布的指标。(2)百分位数法 常用于偏态分布的指标。表 3-1 中两种方法的单双侧界值都应熟练掌握。表 3-1 常用参考值范围的制定正态分布法 百分位数法单 侧 单侧概率( %) 双侧 下 限 上 限 双侧 下 限 上 限 90 SX64.1 28.SX.195P1090P95 964.7.25599 5.23.3. 5.9.0193. 质量控制:为了控制实验中的测量(或实验)误差,常以 作为上、下警戒值,SX2以 作为上、下控制值。这样做的依据是:正常情况下测量(或实验)误差服从正态分SX3布。4. 正态分布是许多统计方法的理论基础。 检验、方差分析、相关和回归分
6、析等多种统t计方法均要求分析的指标服从正态分布。许多统计方法虽然不要求分析指标服从正态分布,19但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。三、典型试题分析1.正态曲线下、横轴上,从均数到 的面积为( )。A95% B50% C97.5% D不能确定(与标准差的大小有关) 答案:B评析 本题考点:正态分布的对称性因为无论 , 取什么值,正态曲线与横轴间的面积总等于 1,又正态曲线以 为 X对称轴呈对称分布,所以 左右两侧面积相等,各为 50%。2若 X 服从以 , 为均数和标准差的正态分布,则 X 的第 95 百分位数等于( )。A B C D
7、64.164.196.158.2答案:B评析 本题考点:正态分布的对称性和面积分布规律正态分布曲线下 范围内面积占 90%,则 外的面积为 10%,又据正态.4.分布的对称性得,曲线下横轴上小于等于 范围的面积为 95%,故 X 的第 95 百分位6.1数等于 。64.13若正常成人的血铅含量 X 近似服从对数正态分布,拟用 300 名正常人血铅值确定 99%参考值范围,最好采用公式( )计算。 (其中 Y=logX)A. B SX58.22.3SC D1log()Y )(log1Y答案:D评析 本题考点:对数正态分布资料应用正态分布法制定参考值范围根据题意,正常成人的血铅含量 X 近似对数正
8、态分布,则变量 X 经对数转换后所得新变量 Y 应近似服从正态分布,因此可以应用正态分布法估计 Y 的 99%参考值范围,再求反对数即得正常成人血铅含量 X 的 99%参考值范围。因血铅含量仅过大为异常,故相应的参考值范围应是只有上限的单侧范围。正态分布法 99%范围单侧上限值是均数+2.33 倍标准差。4正常成年男子红细胞计数近似正态分布,95%参考值范围为 3.605.84 。12(0/)L若一名成年男子测得红细胞计数为 3.10 ,则医生判断该男子一定有病。)/10(2L评析 本题考点:参考值范围的涵义该成年男子不一定有病。因为参考值范围是指绝大多数正常人的指标值范围,故不在此范围内的对
9、象也可能是正常人。5.假定正常成年女性红细胞数 近似服从均值为 4.18,标准差为 0.29 的正态)/10(2分布。令 X 代表随机抽取的一名正常成年女性的红细胞数,求:(1) 变量 X 落在区间(4.00,4.50)内的概率;(2) 正常成年女性的红细胞数 95%参考值范围。评析 本题考点:正态分布的应用(1)根据题意,变量 X 近似服从正态分布,求变量 X 落在区间(4.00,4.50)内的概率,20即是求此区间内正态曲线下的面积问题,因此,可以把变量 X 进行标准化变换后,借助标准正态分布表求其面积,具体做法如下: 4.0184.5018(4.0.5)( )2929PXP).6u6(.
10、735.0变量 落在区间(4.00,4.50)内的概率为 0.5967。X(2)问题属于求某个指标的参考值范围问题,因为正常成年女性红细胞数近似服从正态分布,可以直接用正态分布法求参考值范围,又因该指标过高、过低都不正常,所以应求双侧参考值范围,具体做法如下:下限为: 1.964.8196(0.2)/10(.32L上限为: X75495%的正常成年女性红细胞数所在的范围是 。/.四、习 题(一)单项选择题1.标准正态分布的均数与标准差分别为( )。A0 与 1 B1 与 0 C0 与 0 D1 与 12.正态分布有两个参数 与 ,( )相应的正态曲线的形状越扁平。A 越大 B 越小 C 越大
11、D 越小3.对数正态分布是一种( )分布。A正态 B近似正态 C左偏态 D右偏态4.正态曲线下、横轴上,从均数-1.96 倍标准差到均数的面积为( )。A95% B45% C97.5% D47.5%5.标准正态分布曲线下中间 90%的面积所对应的横轴尺度 的范围是( )。uA-1.64 到+1.64 B 到+1.64 C 到+1.28 D-1.28 到+1.28(二)名词解释1正态曲线2正态分布3. 标准正态分布4. 标准化变换(三)简答题1.简述医学中参考值范围的涵义及制定参考值范围的一般步骤。2.正态分布、标准正态分布与对数正态分布的联系与区别。3.对称分布在“ 1.96 标准差”的范围内
12、,也包括 95%的观察值吗?XS(四)计算题1.假定 5 岁男童的体重服从正态分布,平均体重 =19.5(kg) ,标准差 =2.3(kg) 。21(1)随机抽查一 5 岁男童的体重,计算概率:其体重小于 16.1 kg其体重大于 22.9 kg其体重在 14.6 kg 到 23.9 kg 之间(2)试找出最重的 5%、10%、2.5% 5 岁男童的体重范围。2.某年某地测得 200 名正常成人的血铅含量( )如下,试确定该地正常成人血/10g铅含量的 95%参考值范围。3 4 4 4 4 4 5 5 5 5 5 5 5 5 5 5 6 6 6 66 6 6 7 7 7 7 7 7 7 7 7
13、 7 7 7 7 8 8 8 88 8 8 8 8 8 8 9 9 9 9 9 9 9 10 10 10 10 10 1010 10 10 11 11 11 11 11 12 12 12 12 12 12 12 13 13 13 13 1313 13 13 13 13 13 14 14 14 14 14 14 14 14 14 14 14 15 15 1515 15 15 16 16 16 16 16 16 17 17 17 17 17 17 17 17 17 17 1717 17 18 18 18 18 18 19 19 19 19 19 19 20 20 20 20 20 20 2020
14、21 21 21 21 21 22 22 22 22 22 22 23 23 23 24 24 24 24 2424 25 25 26 26 26 26 26 27 27 28 28 29 29 30 30 31 31 31 3132 32 32 32 32 32 33 33 36 38 38 39 40 41 41 43 47 50 53 603.测得某地 300 名正常人尿汞值,其频数表如表 3-2,试用正态分布法和百分位数法估计该地正常人尿汞值的 90%,95%,99%上限,讨论用何法估计较适宜。 表 3-2 300 例正常人尿汞值 频数表(/)gl尿汞值 例数 尿汞值 例数 尿汞值 例
15、数0 49 24 16 48 34 27 28 9 52 -8 58 32 9 56 212 50 36 4 60 -16 45 40 5 64 -20 22 44 - 6872 14某市 20 岁男学生 160 人的脉搏数(次/分钟) ,经正态性检验服从正态分布。求得76.10, =9.32。试估计脉搏数的 95%、99%参考值范围。XS5.将测得的 238 例正常人发汞值 从小到大排列,最后 14 个发汞值如下,求 95%)/(g单侧上限。发汞值:2.6 2.6 2.6 2.6 2.7 2.7 2.7 2.8 2.8 3.0 3.3 4.0 4.1 4.3秩 次:225 226 227 2
16、28 229 230 231 232 233 234 235 236 237 238五、习题答题要点(一)单项选择题1.A 2.C 3. D 4. D 5. A (二)名词解释1正态曲线:正态曲线(normal curve)是函数, )2()(1)(Xef X22对应的曲线。此曲线呈钟型,两头低中间高,左右对称。2正态分布:若指标 的频率曲线对应于数学上的正态曲线,则称该指标服从正态分X布(normal distribution) 。通常用记号 表示均数为 ,标准差为 的正态分布。),(2N3标准正态分布:均数为 0、标准差为 1 的正态分布被称为标准正态分布(standard normal
17、distribution) ,通常记为 。2(,)4标准化变换: ,此变换有特性:若 服从正态分布 ,则 就服uX),(2Nu从标准正态分布,故该变换被称为标准化变换(standardized transformation) 。(二)简答题1医学中常把绝大多数正常人的某指标范围称为该指标的参考值范围,也叫正常值范围。所谓“正常人”不是指完全健康的人,而是指排除了所研究指标的疾病和有关因素的同质人群。制定参考值范围的一般步骤:(1)定义“正常人” ,不同的指标“正常人”的定义也不同。(2)选定足够数量的正常人作为研究对象。(3)用统一和准确的方法测定相应的指标。(4)根据不同的用途选定适当的百分
18、界限,常用 95%。(5)根据此指标的实际意义,决定用单侧范围还是双侧范围。(6)根据此指标的分布决定计算方法,常用的计算方法:正态分布法、百分位数法。2. 三种分布均为连续型随机变量的分布。正态分布、标准正态分布均为对称分布,对数正态分布是不对称的,其峰值偏在左边。标准正态分布是一种特殊的正态分布(均数为0,标准差为 1) 。一般正态分布变量经标准化转换后的新变量服从标准正态分布。对数正态分布不属于正态分布的范畴,对数正态分布变量经对数转换后的新变量服从正态分布。3.不一定。均数 1.96 标准差范围内包含 95%的变量值是正态分布的分布规律,不是对称分布的规律。对称分布不一定是正态分布。(
19、三)计算题:1.解:(1)设该男童的体重为 X kg,则 19.56.(6.)()(1.48)(.)0.69423PXPu 19.5229.)( (18).3.u (14.6)P= 19.54.6( ()232XX19)(2)u= 13= 0.7.60.5(2)设最重的 5%,10%,2.5%男童体重的下限分别为 kg, kg, kg 1x23x5.)(1xXP19.()23xPu又 9.064u 19.56423(kg)123.x因为正态分布关于均数对称,所以2()0.1PX2229.59.51.19.519.5()()()0.333xXxxxPPu查标准正态曲线下面积表 故 (kg)28x
20、2.4同理 (kg)324.0x2. 解:正常成人的血铅含量近似对数正态分布,经对数转换后应近似服从正态分布,所以对原始数据作对数变换,并编制频数表,再利用正态分布法求 95%参考值范围。对数换算过程如表 3-3 所示。表 3-3 200 名正常成人血铅含量( g /100g)对数值频数表对数组段 真数组段 频数0.45 3 10.55 4 50.65 5 100.75 6 200.85 8 110.95 9 211.05 12 291.15 15 251.25 18 301.35 23 201.45 29 161.55 36 81.65 45 31.751.85 57 1200依据表 3-3
21、,设 为对数组段的组中值, =200, =230, =279.04 xnfx2fx则 ( mol/L) 279.041.5fXn( mol/L)2()279.04(3)/0.731fxfS该地正常成人血铅含量为对数正态分布,按正态分布法估计参考值范围,又因此指标过大属异常,故此参考值范围应为单侧范围。故单侧 95%上限为: ( mol/L))64.1(logXS1log(.5640.2)9所以该地正常成人血铅含量 95%参考值范围上限为 39( mol/L) 。3解:由表 3-2 得 300 名正常人尿汞值 15.08 , =11.10)/lS/(lg用正态分布法估计正常值范围:90%正常值范
22、围上限为: =15.08+1.28(11.10)=29.29SX28.1)/l95%正常值范围上限为: =15.08+1.64(11.10)=33.2864(99%正常值范围上限为: =15.08+2.33(11.10)=40.943. /lg24用百分位数法估计正常值范围:90%正常值范围上限为: 28+ =29.3390P)267%903(4)/(lg90%正常值范围上限为: 36+ =36.005 8599%正常值范围上限为: 52+ =52.009 )( )/(l本题正常人尿汞值属于偏态分布资料,用百分位数法估计较适宜。4解:脉搏数的 95%正常值范围为: =76.10 1.96(9.32)=57.8394.37SX96.1脉搏数的 99%正常值范围为: =76.10 2.58(9.32)=52.05100.375825解: (238+1) 0.95=227.05,则 95%上限即为第 227 个数据与第 228 个数据之间。因为第 227 个和第 228 个数据均为 2.6,故 95%正常值范围的上限应为 2.6 。(/)g(曹素华 杜晓晗)