04-可信区间.ppt-道客多多_道客多多docduoduo.com

资源描述

1、柏建岭南京医科大学公共卫生学院流行病与卫生统计学系,Medical statistics医学统计学,参数估计 Parameter Estimation,2018/6/11,柏建岭讲稿,2,主要内容,点估计区间估计两个要素均数可信区间的构建正确理解可信区间的涵义,2018/6/11,柏建岭讲稿,3,统计推断的内容,参数估计(parameter estimation)假设检验(hypothesis test),2018/6/11,柏建岭讲稿,4,参数估计,由样本统计量估计总体参数点估计(point estimation)区间估计(interval estimation),2018/6/1

2、1,柏建岭讲稿,5,参数估计之一：点估计,用样本统计量作为总体参数的估计例如：用样本均数作为总体均数的一个估计,2018/6/11,柏建岭讲稿,6,点估计的缺陷,=143.37 s = 5.23x1,x2,x3x10,=144.07 s = 4.72 x1,x2,x3x10,=142.72 s = 9.2473 x1,x2,x3x10,样本含量 n=10,2018/6/11,柏建岭讲稿,7,点估计,直接用样本统计量作为总体参数的估计值方法简单，但未考虑抽样误差的大小在实际问题中，总体参数往往是未知的，但它们是固定的值，并不是随机变量值。而样本统计量随样本的不同而不同，属随机的。,2018

3、/6/11,柏建岭讲稿,8,区间估计,按一定的概率或可信度(1- )用一个区间估计总体参数所在范围，这个范围称作可信度为1- 的可信区间(confidence interval, CI)，又称置信区间。这种估计方法称为区间估计。,2018/6/11,柏建岭讲稿,9,可信区间的两个要素,可信度(1-), 可靠性一般取90%，95%。可人为控制。精确性是指区间的大小(或长短)兼顾可靠性、精确性,2018/6/11,柏建岭讲稿,10,均数的可信区间,基础：抽样误差理论从正态分布总体中随机抽取一个样本，则t值接近于0的可能性较大，远离0的可能性较小，出现太大的t值和太小的t值的可能性更小，根据t分布

4、的性质，,2018/6/11,柏建岭讲稿,11,均数的可信区间,总体均数的(1- )可信区间定义为：,2018/6/11,柏建岭讲稿,12,影响可信区间大小的因素,可信度可信度越大，区间越宽个体变异变异越大，区间越宽样本含量样本含量越大，区间越窄,2018/6/11,柏建岭讲稿,13,当样本含量较大时，例如n100，t分布近似标准正态分布，此时可用标准正态分布代替t分布，作为可信区间的近似计算。相应的100(1-)%可信区间为：,2018/6/11,柏建岭讲稿,14,例4.1,随机抽取12名口腔癌患者，检测其发锌含量，得均数为253.05g/g，标准误为27.18g/g，求发锌含量总体均数95

5、%的可信区间。,2018/6/11,柏建岭讲稿,15,附表2 t 界值表,2018/6/11,柏建岭讲稿,16,本例自由度n =12-1=11，经查表得t0.05,11=2.201，则即口腔癌患者发锌含量总体均数的95%可信区间为：193.23321.87(g/g)。用该区间估计口腔癌患者发锌含量总体均数的可信度为95%。,例4.1,2018/6/11,柏建岭讲稿,17,例4.2,某地120名12岁男孩身高均数为142.67cm，标准误为0.5477cm，计算该地12岁男孩身高总体均数90%的可信区间。,2018/6/11,柏建岭讲稿,18,附表2 t 界值表,2018/6/11,柏建岭讲稿,

6、19,例4.2,n=120100，标准正态分布代替t分布，u0.10=1.64 即该地12岁男孩平均身高的90可信区间为：141.77143.57(cm)，可认为该地12岁男孩平均身高在141.77143.57(cm)之间。,2018/6/11,柏建岭讲稿,20,均数之差可信区间的计算,正常组肝炎组, 1- 2 ？,2018/6/11,柏建岭讲稿,21,与均数之差有关的抽样分布,“均数之差”与“均数之差的标准误”之比，服从自由度 = n1+n2 -2的 t 分布。样本含量较大时，服从标准正态分布。,2018/6/11,柏建岭讲稿,22,合并方差与均数之差的标准误,合并方差(方差的加权平均)均

7、数之差的标准误,2018/6/11,柏建岭讲稿,23,计算,2018/6/11,柏建岭讲稿,24,正确理解可信区间的涵义,可信区间一旦形成，它要么包含总体参数，要么不包含总体参数，二者必居其一，无概率可言。所谓95的可信度是针对可信区间的构建方法而言的。以均数的可信区间为例，其涵义是：如果重复100次抽样，每次样本含量均为n，每个样本均按构建可信区间，则在此100个可信区间内，理论上有95个包含总体均数，而有5个不包含总体均数。,2018/6/11,柏建岭讲稿,25,95%可信区间的含义,按这种方法构建的可信区间，理论上平均每100次，有95次可以估计到总体参数。,2018/6/11,柏建

8、岭讲稿,26,正确理解可信区间的涵义,在区间估计中，总体参数虽未知，但却是固定的值（且只有一个），而不是随机变量值。,2018/6/11,柏建岭讲稿,27,下列说法正确吗？,算得某95%的可信区间，则：总体参数有95%的可能落在该区间。有95%的总体参数在该区间内。该区间包含95%的总体参数。该区间有95%的可能包含总体参数。该区间包含总体参数，可信度为95%。,2018/6/11,柏建岭讲稿,28,可信区间与参考值范围的区别,可信区间用于估计总体参数，总体参数只有一个。参考值范围用于估计变量值的分布范围，变量值可能很多甚至无限。95%的可信区间中的95%是可信度，即所求可信区

9、间包含总体参数的可信程度为95%95%的参考值范围中的95%是一个比例，即所求参考值范围包含了95%的正常人。,2018/6/11,柏建岭讲稿,29,标准差与标准误的联系,都是变异指标。当n不变时，标准差，标准误,2018/6/11,柏建岭讲稿,30,标准差与标准误的区别,标准差描述原始数据的离散程度；标准误反映均数的抽样误差大小。,2018/6/11,柏建岭讲稿,31,标准差与标准误的区别,标准差衡量样本均数对原始数据的代表性，标准差越小，样本均数对原始数据的代表性越好；标准误衡量样本均数估计总体均数的精确性，标准误越小，样本均数估计总体均数精度越高。,2018/6/11,柏建岭讲稿,32,标准差与标准误的区别,当 nN 时，样本标准差总体标准差当 nN 时，标准误0,2018/6/11,柏建岭讲稿,33,标准差与标准误的区别,结合样本均数和正态分布的规律，标准差估计参考值范围；结合样本均数和t分布的规律，标准误估计总体均数的可信区间。,2018/6/11,柏建岭讲稿,34,概念辨析,标准差标准误个体变异抽样误差参考值范围可信区间变量分布抽样分布,2018/6/11,柏建岭讲稿,35,Homework,简述标准差和标准误的区别和联系简述参考值范围与均数的可信区间的区别和联系,2018/6/11,柏建岭讲稿,36,

展开阅读全文