1、第二章 统计描述,第四节 正态分布 (Normal distribution),正态分布(Normal Distribution),概述: 正态分布是描述连续型变量值分布的曲线,医学资料许多服从正态分布。直方图的频数分布与正态分布 (见图2-4),图2-4 频数分布与正态分布示意图,一、正态分布的概念和特征,1.正态分布曲线的数学函数表达式:,X为连续随机变量,为X值的总体均数,2 为总体方差,记为XN( , 2),(-X ),(2-17),2、正态分布曲线理论上的特征,(1)以X= 为中心,左右X值对称性减少。 (2)在X= 处曲线最高,f(X=)为最大值。 3. 、决定 正态分布曲线位置和
2、形状 固定 ,随 不同,曲线位置不同,称为位置参数, 固定 ,越大,曲线形状不同, 称为形状参数,正态分布是一个分布族。,图2-5 正态分布参数位置变化示意图,图2-6 正态分布变异度不同变化示意图,4.理论上,有中位数=均数() 5.任何正态分布的X通过u值转换后,称为标准化的正态分布,即u N( =0 , 2=1),标准正态分布方程,u为标准化变量值,三、正态曲线下面积(概率)的分布及估计方法,1.曲线下ab区间面积的含义 (1)表示X值在ab区间占全部变量值的百分比或表示X值在ab区间出现的概率(P)。(2)X在曲线下整个面积分布为100% 或X值在曲线范围内出现的概率为1。,2.估计曲
3、线下面积的方法,将变量值(X)转换为u值后,查标准正态分布表(P520),可估计曲线下ab区间的面积。,(2-21),表示从到u值范围内X分布面积,标准正态分布曲线下面积,例:标准正态变量值u=(-1,1)和u=(-1.96,1.96)区间的面积(概率)各为多少?,同理:u=(-2.58,2.58)区间的面积为0.99,记为:,有:,变量值分布的范围表达,X占的百分比(%),68.27%,95.00%,99.00%,任意正态分布变量值(X)理论上分布规律,3.医学常用的三个X 分布范围及u界值,(1)X值分布范围,u0.05/2=1.96 (双侧) u0.01/2=2.58(双侧) u0.05
4、=1.64 (单侧) u0.01=2.33(单侧),(2)统计中常用尾部面积的u值,记 ,称为u界值。,三、正态分布的应用1.估计正态分布X值在特定值范围内的分布比例。例:2.制定某临床指标的的参考值范围3.利用 估计变量值的范围或对极端值做取舍。4.许多统计方法的统计推断建立在正态分布基础上。,例2.14 101名正常成年女子的血清总胆固醇 , 。试估计该总体正常女子血清总胆固醇在4mmol/l以下者的百分比。,解:假定该资料服从正态分布,将X1=4转换为u值,查正态分布表,用,查表,标准正态变量(u1)=0.09,该地正常女子血清总胆固醇在4mmol/l以下者的百分比为46.41%。,第五
5、节 医学参考值范围的制定,一概念 医学参考值是指包括绝大多数“正常人”的各种生理及生化指标常数,也称正常值。 由于存在个体差异,正常值并非为常数,而是在一定范围内波动,医学上常用95%或99%的分布范围作为判定正常和异常的参考标准。,二、医学参考值制定时注意问题:1.确定诊断指标为“定性”或“定量” 2.有无“金标准方法”考核 3.计量资料考虑制定单侧诊断界值还是双侧诊断界值 4.有足够的样本例数(一般不低于100例),三、计量资料参考值的制定,1.正态分布法(一般要对资料进行正态性检验) 双侧 参考值范围公式:单侧 参考值范围公式:,下限值或,上限值,例2-15 估计例2-1某单位101名正
6、常成年女子血清总胆固醇的参考值范围。假设该资料服从正态分布。 已知:计算95%的参考范围(双侧)结论:正常成年女子血清总胆固醇95%的参考值范围为2.78-5.34(mmol/l),2.百分位数法,偏态分布资料医学参考值范围的制定通常采用百分位数法,。 双侧 参考值范围: 单侧 参考值范围:,或,例:讲义,常用=0.05,上限值,下限值,表 例:102名3岁以下儿童LgA含量,组段(d) 频数 累计频数 位次范围0- 29 29 1-29 15- 32 61 30-61 30- 18 79 62-79 45- 14 93 80-93 60- 4 97 94-97 75- 0 97 97 90- 0 97 97 105- 2 99 98-99 120- 1 100 100 135- 2 102 101-102合计 102,例: 102名3岁以下儿童LgA含量,该地3岁以下儿童LgA含量的分布最小、最大范围为0-135(单位),由上式可见,该资料不服从正态分布。,变量值95%的分布范围,正态分布要求,本节要求: 1.正态分布理论上的4点特征 2.能正确使用标准正态分布表(利用u值) 3.掌握正态分布的三个常用的分布规律。小结: 正态分布法和百分位数法可以对个体做评价,可以了解一定范围X值的比例。,