1、数值变量统计分析,集中趋势和离散趋势的描述,统计推断,均数的抽样误差及t分布的特点,总体均数的估计,假设检验,第十六章 总体均数的估计和两均数的假设检验,复习几个概念: 计量资料:测定每个观察单位某项指标量的大小得到的数 据 (资料)。总体: 研究对象(某项变量值)的全体。样本: 总体中随机抽取的一部分研究对象的某项变量值。统计量:从样本计算出来的统计指标。参数: 总体的统计指标叫总体参数。,统计推断:用样本信息推论总体特征的过程。 包括: 参数估计: 运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计。假设检验:又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是
2、否存在着差别做出判断。,总体,样本,抽取部分观察单位,统计量,参 数,统计推断 statistical inference,如:总体均数总体标准差总体率,如:样本均数样本标准差S样本率 P,主要内容,第一节 均数的抽样误差与标准误 第二节 t 值与t分布 第三节 总体均数的估计 第四节 假设检验的一般步骤 第五节 样本均数与总体均数的比较,样本,统计量,第一节 样本均数的标准误,如:样本均数样本标准差S样本率 P,正态(分布)总体: 推断 !,部分=总体?,第一节 标准误,一、概念 抽样误差:由于抽样引起的样本统计量与总体参数之间的差异(举例,抽样误差的产生及含义)。 标准误 :符号,表示抽样
3、误差大小的指标;样本均数的标准差;,一、抽样研究与抽样误差,抽样研究的目的是要用样本信息推断总体特征,称统计推断。 1、抽样研究:从总体中随机抽取一定数量的观察单位组或样本,对其进行研究,以此来推断总体的情况。 如从某地8岁的男孩中,随机抽取200人,分别测量其身高,计算样本均数,用来估计该地8岁男孩身高的总体均数就属于抽样研究。 2、 均数的抽样误差(sampling error) :是指由抽样造成的样本均数与总体均数之差 。,如要了解某地成年男子红细胞数的总体均数,抽得144个样本,求出样本均数 =5.381012/L,估计该地成年男子红细胞数的总体均数,由于抽样误差 , -称均数的抽样误
4、差。,二、标准误,概念: 均数的标准误,简称标准误(standard error, SE):说明均数抽样误差大小的指标。即由样本均数估计总体均数可靠性大小的指标。,X 1 S1X 2 S2 X I SiX n Sn,x,标准误示意图,表示样本统计量抽样误差大小的统计指标。 均数标准误:说明均数抽样误差的大小,总体计算公式(3-1),2、标准误(standard error, SE),实质:样本均数的标准差,若用样本标准差S 来估计 ,(3-2)降低抽样误差的途径有:,通过增加样本含量n; 通过设计减少S,标准误,标准误,标准误,标准误,标准误,标准误,标准误,4.标准误与标准差的比较,三、 (
5、均数)标准误 意义:反映抽样误差的大小。标准误越小,抽样误差越小,用样本均数估计总体均数的可靠性越大。 与样本量的关系:S 一定,n,标准误,二、(均数)标准误的计算,第二节 t 分布,复习两个概念: 正态分布 标准正态分布 (u 分布),大样本、小样本概念:30 、 50 、 100。 量变引起质变:当样本容量较大时,其统计量的抽样分布近似为正态分布。随着N的增大,越来越接近于正态分布(样本均数的分布)。 但当样本量小于100时,抽样分布不能再用正态分布来近似,随着N的减小,与正态分布的差别越来越大,需要用小样本理论来解释(样本均数的分布) 。,一、t分布,随机变量X N(m,s2),标准正
6、态分布 N(0,12),u变换,标准正态分布 N(0,12),正态分布,t 分布(与u 分布比较的特点),t 值表(附表2 P367)横坐标:自由度, 纵坐标:概率, P, 即曲线下阴影部分的面积; 表中的数字:相应的 |t | 界值。,t 值表规律: (1) 自由度()一定时,P与 t 成反比; (2) 概率(P) 一定时, 与 t 成反比;,第二节 t 值与 t 分布,一、t值,t值为样本均数与总体均数相差多少个标准误,二、t分布,从同一总体中抽取许多大小相同的样本,可得到许多 及s, 代入(163),就可以得到许多的t值,将这些t值绘成直方图,当样本无限多时,就绘成一条光滑的曲线,这就是
7、 t 分布曲线。这种t值的分布就叫 t 分布,二、t分布,特征 :t界值表,将不同自由度,不同概率P(从正态总体作随机抽样得样本t值落在该区间的概率)(即检验水准)的t值列成表格称t界值表,t 分布,t分布左右两端尾部面积之和=0.05(即每侧尾部面积为0.025)相应的t值称为5%界,符号为t0.05,,这里是自由度。 把左右两端尾部面积之和为0.01相应的t值称为1%界,符号为t0.01,。 t的5%界与1%界可查附表5 t值表。 例如当自由度为10-1=9时,t0.05,9=2.262,t0.01,9=3.250。,t分布曲线下面积(附表2),双侧t0.05/2,92.262单侧t0.0
8、25,9 单侧t0.05,91.833 双侧t0.01/2,93.250单侧t0.005,9 单侧t0.01,92.821 双侧t0.05/2,1.96单侧t0.025, 单侧t0.05, 1.64,u,t,t 分布,举例:,小结,标准正态分布 当0,1,使原来的正态分布变换为标准正态分布,亦称u分布,区间的面积分别占总面积的68.27 1.96 为95 2.58为 99。,|u|1.96的面积为0.05,正态曲线下面积的分布规律,小结,t 分布 :,t分布把t分布左右两端尾部面积之和=0.05(即每侧尾部面积为0.025)相应的t值称为5%界,符号为t0.05, 把左右两端尾部面积之和为0.
9、01相应的t值称为1%界,符号为t0.01,三总体均数的参数估计,统计推断,假设检验,参数估计,参数估计就是用样本指标(即统计量)来估计总体指标(即参数),点值估计,区间估计,总体均数的估计,统计推断的任务就是用样本信息推论总体特征。参数估计,用样本均数估计总体均数。 1、 点(值)估计(近似值)2、 区间估计(近似范围),1、点(值)估计: 用样本均数直接作为总体均数的估计值, 未考虑抽样误差。,总体均数的点值估计,点值估计,就是以某一样本均数来作总体均数的估计,如随机抽查140例成年男子,测得红细胞的均值为4.791012/L, 以此值作为某地成年男子的总体均数的估计值, 叫“点值估计”。
10、,点值估计比较方便、简单。但由于存在抽样误差,不同的样本可能得到不同的估计值,所以其准确度较低。,2、区间估计, 概念:根据样本均数,按一定的可信度计算 出总体均数很可能在的一个数值范围,这个范围称为总体均数的可信区间。 方法: (1) u 分布 法 (2) t 分布法,(1)u 分布 法,公式,应用条件:,例题,意义:与正常值范围进行比较,(xus x,xu s x) 即(xus x),样本量较大, 已知或可计算出 x 及 Sx,换句话说,做出该市成人脉搏均数为73.9次/分 75.1次/分的结论,说对的概率是95%,说错的概率是5%;做出该市成人脉搏均数为73.7次/分 75.3次/分的结
11、论,说对的概率是99%,说错的概率是1%。,意义:虽然不能知道某市全体成人脉搏均数的确切数值,但有95%的把握说该市全体成人脉搏均数在73.9次/分 75.1次/分之间,有99%的把握说该市全体成人脉搏均数在 73.7次/分 75.3次/分之间。,换句话说,做出校全体女大学生身高均数为163.0 164.5cm的结论,说对的概率是95%,说错的概率是5%;做出校全体女大学生身高均数为162.7 164.7cm的结论,说对的概率是99%,说错的概率是1%。,意义:虽然不能知道某校全体女大学生身高均数的确切数值,但有95%的把握说校全体女大学生身高均数在163.0 164.5cm之间,有99%的把
12、握说校全体女大学生身高均数在 162.7 164.7cm之间。,(2)t 分布 法,公式,应用条件,例题,意义,(x ts x,xt s x) 即(xts x),样本量 较小, 已知或可计算出 X 及,s x,二、总体均数的区间估计,区间估计(interval estimation)是按一定的概率来估计总体均数在哪个范围。 预先给定的概率称为可信度,符号为1 ,常取95%或99%;按此确定的可信区间分别称为95%或99%可信区间。意思是说,从被估计的总体中随机抽取若干个含量为 n 的样本,由每个样本计算出一个95%可信区间,理论上,其中有95%的可信区间将包含被估计的总体均数。以样本对95%可
13、信区间作估计时,被估计的总体均数不在该区间的概率是很小的,仅5%。,(一) 总体均数可信区间的计算,(一) 总体均数可信区间的计算,t0.05,9=2.262, t0.01,9=3.250,(一) 总体均数可信区间的计算,(一) 总体均数可信区间的计算,(一) 总体均数可信区间的计算,(2)已知 (3) 未知,但n足够大,n100,例3-3 某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64 mmol/L,标准差为1.20mmol/L,估计该地正常成年人血清胆固醇均数的95%可信区间。,故该地正常成年人血清胆固醇均数的双侧95%可信区间为(3.47, 3.81)mmolL。,100,
14、可信区间的解释,95可信区间:从总体中作随机抽样,作100次抽样,每个样本可算得一个可信区间,得100个可信区间,平均有95个可信区间包括(估计正确),只有5个可信区间不包括(估计错误)。,95可信区间 99可信区间公式区间范围 窄 宽估计错误的概率 大(0.05) 小(0.01),区间估计的准确度:说对的可能性大小, 用 (1-) 来衡量。99%的可信区间好于95%的可信区间 (n, S 一定时) 。 区间估计的精确度:指区间范围的宽窄,范围越宽精确度越差。99%的可信区间差于95%的可信区间(n, S 一定时) 。 准确度与精确度的关系: (例如预测孩子的身高),(三)可信区间与可信限的关
15、系,正常值范围估计与可信区间估计,第四节 假设检验,显著性检验; 科研数据处理的重要工具; 某事发生了:是由于碰巧?还是由于必然的原因?统计学家运用显著性检验来处理这类问题。,假设检验: 1、原因 2、目的 3、原理 4、过程(步骤) 5、结果,1、假设检验的原因,由于个体差异的存在,即使从同一总体中严格的随机抽样,X1、X2、X3、X4、,不同。因此,X1、X2 不同有两种(而且只有两种)可能: (1)分别所代表的总体均数相同,由于抽样误差造成了样本均数的差别。差别无显著性 。 (2)分别所代表的总体均数不同。差别有显著性。,2、假设检验的目的,3、假设检验的原理/思想,反证法:当一件事情的
16、发生只有两种可能A和B,为了肯定其中的一种情况A,但又不能直接证实A,这时否定另一种可能B,则间接的肯定了A。 概率论(小概率) :如果一件事情发生的概率很小,那么在进行一次试验时,我们说这个事件是“不会发生的”。从一般的常识可知,这句话在大多数情况下是正确的,但是它一定有犯错误的时候,因为概率再小也是有可能发生的。,判断是由于何种原因造成的不同,以做出决策。,假设检验的基本思想,小概率反证法在一次研究观察中,如果出现了假设成立情况下的小概率事件,由于推理过程是严密的,就只能认为假设不成立,应予拒绝或否定,并接受它的对立面。,假设,推导,小概率事件,否定,假设检验,例 3.4 据大量调查知,健
17、康成年男子脉搏的均数为72次/分,某医生在山区随机调查了25名健康成年男子,其脉搏均数为74.2次/分,标准差为6.5次/分,能否认为该山区成年男子的脉搏高于一般人群?,两均数不相等的原因有两种可能: 由于抽样误差所致; 样本来自另一总体(由于环境条件的影响,山区成年男子的脉搏确实高于一般)。 判断的方法:假设检验,4、假设检验的一般步骤, 建立假设(反证法): 确定显著性水平( ): 计算统计量:u, t,2 确定概率值: 做出推论,1.建立检验假设,确定检验水准,假设有两种: 一是无效假设(null hypothesis)或称零假设,用H0示之; 二是备择假设(alternative hy
18、pothesis),用H1示之。 H0和H1都是根据统计推断的目的提出的对总体特征的假设,是相互联系且对立的一对假设。,1.建立检验假设,确定检验水准,建立假设前,先要根据分析目的和专业知识明确单侧检验还是双侧检验。(例) 样本均数(其总体均数为)与已知总体均数0的比较目的 H0 H1 双侧检验 是否0 =0 0 单侧检验 是否0 =0 0或是否0 =0 0,1.建立检验假设,确定检验水准,检验水准(significance level),符号为,常取0.05 ,是小概率事件在假设检验中的体现; 检验水准应在设计时根据专业知识和研究目的确定; 单侧检验或双侧检验以及检验水准,不能在假设检验结果
19、得出后再加以选择。,游戏规则,2.选定检验方法,计算检验统计量,根据分析目的、设计类型和资料类型,选用适当的检验方法,计算相应的统计量。,3.确定P值,作出统计推断,P值是指在H0所规定的总体中随机抽样,获得等于及大于(或等于及小于)现有样本统计量的概率。P值越小,说明差异来自抽样误差的可能性就越小,来自本质差异可能性就越大。,3.确定P值,作出统计推断,统计学结论 若P,表示在H0成立的条件下,出现等于及大于现有统计量的概率是小概率,按小概率事件原理现有样本信息不支持H0,因而拒绝H0。因此,当P时,按所取检验水准,拒绝H0,接受H1。 可以认为 同时应给出专业结论,孰高孰低,谁大谁小,3.
20、确定P值,作出统计推断,若P时,表示在H0成立的条件下,出现等于及大于现有统计量的概率不是小概率,现有样本信息还不足以拒绝H0。 尚不能认为,第四节 假设检验的一般步骤,5、假设检验的结果,接受检验假设 拒绝检验假设 正确理解结论的概率性(都隐含着犯错误的可能性)。,两均数的假设检验,一、单样本 t 检验样本均数与总体均数的比较 二、配对t 检验 成对资料均数的 t 检验 三、两样本t检验成组资料两样本均数的比较 方差不齐时两小样本均数的比较,一、单样本 t 检验,(一)大样本一般女性平均身高160.1 cm。某大学随机抽取100名女大学生,测量其身高,身高的均数是163.74cm,标准差是3
21、.80cm。 请问某大学18岁女大学生身高是否与一般女性不同。,目的:比较样本均数所代表的未知总体均数 与已知的总体均数有无差别 计算公式:u 统计量=, 适用条件: (1) 已知一个总体均数; (2) 可得到一个样本均数; (3) 可得到该样本标准误; (4) 样本量不小于100。,例题: (1) 一个总体均数:160.1 cm ; (2) 一个样本均数:163.74 cm ; (3) 可计算出样本标准误 (4) n = 100;,假设检验: 建立假设: 检验假设:某校女大学生身高均数与一般女子身高均数相同; H0:=0; 备择假设 :某校女大学生身高均数与一般女子身高均数不同; H1:0
22、确定显著性水平( ):0.05, 做出推论: U= 9.58 1.96, p 0.05 = , 小概率事件发生了,原假设不成立;拒绝H0 , 接受H1, 可认为:某校女大学生身高均数与一般女子身高均数不同;某校女大学生身高均数与一般女子身高均数差别有显著性。, 计算统计量:u 统计量: u =, 确定概率值: |u|=9.58 u = 1.96 u u p =0.05;,(二)小样本 已知中学一般男生的心率平均为74次/分钟。为了研究常参加体育锻炼的中学生心脏功能是否与一般的中学生相同,在某地区中学生中随机抽取常年参加体育锻炼的男生16名,测量他们的心率,结果均数为65.63次/分 ,标准差为
23、7.2次/分。,目的:比较一个小样本均数所代表的未知总体均数与已知的总体均数有无差别。 计算公式:t 统计量:t=自由度:=n - 1, 适用条件: (1) 已知一个总体均数; (2) 可得到一个样本均数及该样本标准误; (3) 样本量小于100; (4) 样本来自正态或近似正态总体。,例题: 已知: (1) 一个总体均数:74次/分 ; (2) 一个样本均数:65.63次/分 ; (3) 可计算出样本标准误 (4) n =16 100;,假设检验: 建立假设: 检验假设:常参加体育锻炼的中学男生的心率与一般中学生相等; H0:=0; 备择假设 :常参加体育锻炼的中学男生的心率与一般中学生不同
24、; H1:0 确定显著性水平( ):0.05, 计算统计量:t = : t =4.65 确定概率值: n= 16, 自由度 = n 1 = 15, t0.05(15) = 2.131 t t0.05(25) , p 0.05 做出推论: p 0.05 , 小概率事件发生了,原假设不成立;拒绝H0 , 接受H1, 可认为:常参加体育锻炼的中学男生的心率与一般中学生不同;常参加体育锻炼的中学男生的心率比一般中学生心率慢;常参加体育锻炼的中学男生的心率与一般中学生差别有显著性。,二、配对t 检验 (paired / matched t-test),什么是配对设计资料?,将可能影响指标的一些特征相同或
25、近似的两个个体配成一对,然后按照随机化方法将每个对子内的两个个体用不同的两种方法进行处理。对处理的结果进行分析。 有哪几种形式?,1比较目的:通过对两组配对资料的比较,判断不同的处理效果是否有差别,或某种治疗方法是否起作用。 2公式: t = = 自由度: = 对子数 - 1 3.适用条件: 将人或动物进行配对,配好的每对个体分别随机地分到 两个不同的处理组中去,接受不同处理。 观察同一批病人在治疗前后的变化,治疗前的数值和治 疗后的数值也是配对资料。 同一批病人或动物用不同的方法处理。,例题: 为考察一种新型透析疗法的效果,随机抽取了10名病人测量透析前后的血中尿素氮含量如下表,请根据本实验
26、资料对此疗法进行评价。,. H0:d = 0 H1:d 0 . 确定显著性水平 = 0.05 ,单侧检验 . 计算统计量: t =7.826,. 确定概率:=10 - 1=9。 查表 t 0.05(9) =1.833t = 7.826 t 0.05(9) p 0.05 . 判断结果:因为p 0.05,故拒绝检验假设H0, 10名病人透析前后血中尿素氮含量差异有显著性,即透析可以降低血中尿素氮含量。,二、配对t 检验,单侧检验,10,二、配对t 检验,二、配对t 检验,二、配对t 检验,例3-6 为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,某人随机抽取了10份乳酸饮料制品,分别用脂肪酸水
27、解法和哥特里罗紫法测定其结果如表3-3第(1)(3)栏。问两法测定结果是否不同?,表3-3 两种方法对乳酸饮料中脂肪含量的测定结果(%),(1)建立检验假设,确定检验水准 H0:d0,即两种方法的测定结果相同 H1:d0,即两种方法的测定结果不同 =0.05(2)计算检验统计量 本例n=10,d=2.724,d2=0.8483,,按公式(3-16)(3)确定P值,作出推断结论查附表2的t界值表得P0.001。按=0.05水准,拒绝H0,接受H1,有统计学意义。可认为两种方法对脂肪含量的测定结果不同,哥特里罗紫法测定结果较高。,三、两样本t检验,例题: 为了比较国产药和进口药对治疗更年期妇女骨质
28、疏松效果是否相同,采取随机双盲的临床试验方法。国产药组20例,进口药组19例,评价指标为第2-4腰椎骨密度的改变值(骨密度.sav)。,目的:由两个样本均数的差别推断两样本 所代表的总体均数间有无差别。 计算公式及意义:t 统计量: t = 自由度 = n1+n2 2, 适用条件: (1)已知/可计算两个样本均数及它们的标准差 ; (2)两个样本之一的例数少于100;,第七节 成组资料两样本均数的比较,一、成组资料两样本均数比较的t检验,=n1+n2-2,t,例题: 已知: 一个样本: 均数48.25, 标准差32.0; 另一个样本:均数36.37, 标准差27.65; (2) n1=20;
29、n2=19,假设检验: 建立假设: 检验假设:两组药疗效相同; 备择假设 :两组药疗效不同不同; 确定显著性水平( ):0.05, 计算统计量:t 统计量: t = 1.238; 自由度:20+ 19 2 = 37 表中: t 0.05(37) = 2.026 确定概率值: t 0.05; 做出推论: 因为 p 0.05 , 不能拒绝H0: 认为 两组药疗效相同。可以用国产药代替进口药。,例3-7 为研究国产四类新药阿卡波糖胶囊的降血糖效果,某医院用40名II型糖尿病病人进行同期随机对照试验。试验者将这些病人随机等分到试验组(用阿卡波糖胶囊)和对照组(用拜唐苹胶囊),分别测得试验开始前和8周后
30、的空腹血糖,算得空腹血糖下降值见表3-4,能否认为该国产四类新药阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果不同?,(2)计算检验统计量,(3)确定P值,作出推断结论,四、方差不齐时两小样本均数的比较,一、两个方差的齐性检验,3.确定P值,作出统计推断1=n1-1,2=n2-1,查附表方差齐性检验用的F分布表,如果,即P,因此拒绝H0,接受H1。认为两个总体的方差不等。否则不拒绝H0,认为两个总体的方差相等。,成组资料的方差齐性检验,(一)两个方差的齐性检验,(二) t 检验 调整 t 界值,例3-8 在上述例3-7国产四类新药阿卡波糖胶囊的降血糖效果研究中,测得用拜唐苹胶囊的对照组20例病人
31、和用阿卡波糖胶囊的试验组20例病人,其8周时糖化血红蛋白HbA1c(%)下降值如表3-5。问用两种不同药物的病人其HbA1c下降值是否不同?,表3-5 对照组和试验组HbA1c下降值(%),对照组方差是试验组方差的3.77倍,经方差齐性检验,认为两组的总体方差不等,故采用近似 t 检验。,(1)建立检验假设,确定检验水准(略),(2)计算检验统计量,(3)确定P值,作出推断结论。 查t界值表t0.05/2,19=2.093。,由t=0.9650.05。按=0.05水准,不拒绝H0,无统计学意义。还不能认为用两种不同药物的病人其HbA1c下降值不同。,第九节 均数假设检验的注意事项,1、正确理解
32、假设检验的结论(概率性) 假设检验的结论是根据概率推断的,所以不是绝对正确的: 当 p , 不能拒绝 H0, 不能接受H1,按不能接受H1下结论,也可能犯错误;,(1) 当拒绝 H0 时, 可能犯错误,可能拒绝了实际上成立的H0, 称为 类错误( “弃真”的错误 ),其概率大小用 表示。 (2)当不能拒绝 H0 时,也可能犯错误,没有拒绝实际上不成立的H0 , 这类称为 II 类错误( ”存伪”的错误), 其概率大小用 表示, 值一般不能确切的知道。,2、第 I 类错误和第 II 类错误,假设检验的结果有两种。,II 类错误的概率 值的两个规律:1. 当样本量一定时, 愈小, 则 愈大,反之;
33、2.当 一定时, 样本量增加, 减少.,3. 统计学中的差异显著或不显著,和日常生活中所说的差异大小概念不同. (不仅区别于均数差异的大小,还区别于均数变异的大小),4、其它注意事项 选择假设检验方法要注意符合其应用条件; 当不能拒绝H0时,即差异无显著性时,应考虑 的因素:可能是样本例数不够;单侧检验与双侧检验的问题,第十节 可信区间与假设检验的联系与区别,1. 可信区间也可以回答假设检验的问题2. 可信区间比假设检验可提供更多的信息,有关假设检验公式,1.样本均数与总体均数的比较,正态分布的资料 ,大样本或样本虽小但总体标准差已知时,未知的小样本正态分布资料,2.成对资料均数的 t 检验,
34、有关假设检验公式,成组资料两样本均数的比较 =两大样本均数,有关假设检验公式,两个方差的齐性检验:F=12 /22,1. 均数的标准误与标准差的区别,2、t分布概念和性质,随机变量X N(m,s2),标准正态分布 N(0,12),u变换,标准正态分布 N(0,12),正态分布,t分布曲线,t 分布有如下性质: 单峰分布,曲线在t0 处最高,并以t0为中心左右对称 与正态分布相比,曲线最高处较矮,两尾部翘得高(见绿线) 随自由度增大,曲线逐渐接近正态分布;分布的极限为标准正态分布。,3、参数估计和假设检验,可信区间的解释,95可信区间:从总体中作随机抽样,作100次抽样,每个样本可算得一个可信区间,得100个可信区间,平均有95个可信区间包括(估计正确),只有5个可信区间不包括(估计错误)。,4.两均数差别检验的比较:,大样本也可近似用u检验,THANK YOU !,您的建议是我进步的源泉!,