1、学习目标,掌握基本SAS过程的调用 掌握单样本、配对设计资料、两独立样本t检验的基础理论及其SAS分析程序;,1,概述,SAS系统的BASE软件提供了一些计算基础统计量的过程,如:means过程、univariate过程、ttest过程。 这些过程可完成单变量或多变量的描述统计量计算。 它们也可完成各种t检验。,2,MEANS过程,MEANS过程功能是对计量数据进行统计描述与单样本或配对设计资料的t检验,它的一般格式如下:,3,选项列表,vardef=df/weight/wgt/n/wdf在方差计算中规定除数d.。 descending规定输出数据集按_type_值下降的次序(缺省时为上升)。
2、 order=freq/data/internal/formatted/规定输出时class变量按所指定方式排序。 alpha=数字设置计算置信区间的置信水平 , 值在0与1之间。,4,5,统计量关键字,output语句中的选项,输出数据集名。 统计量关键字=变量名列表规定在输出数据集中要包含的统计量并规定这些统计量在新数据集中的变量名。 means过程对output语句的次数没有限制,可以使用几个output语句来创建内容不同的多个数据集。,6,其它语句,var语句分析的连续型变量。 by语句分组变量,须事先排序。 class语句分组变量,无须事先排序。 freq语句指定频数。 weight
3、语句指定权重。 id语句在输出数据集中增加一个或几个附加变量,目的在于识别输出数据集里的观测。其值为生成这个观测的输入数据集中相应观测组里id变量具有的最大值。,7,UNIVARIATE过程,UNIVARIATE过程功能是对计量数据进行更为详细的统计描述、少量统计图、正态性检验与单样本或配对设计资料的t检验,它的一般格式如下:,8,选项列表,vardef=df/weight/wgt/n/wdf在方差计算中规定除数d.。 normal要求计算关于输入数据服从正态分布的假设的检验统计量。 plot要求生成一个茎叶图、一个盒型图和一个正态概率图。 pctldef=1/2/3/4/5规定计算百分位的五
4、种方法, 缺省值为5。,9,10,统计量关键字,output语句中的选项,输出数据集名。 统计量关键字=变量名列表规定在输出数据集中要包含的统计量并规定这些统计量在新数据集中的变量名。 means过程对output语句的次数没有限制,可以使用几个output语句来创建内容不同的多个数据集。,11,其它语句,var语句分析的连续型变量。 by语句分组变量,须事先排序。 freq语句指定频数。 weight语句指定权重。 id语句在输出数据集中增加一个或几个附加变量,目的在于识别输出数据集里的观测。其值为生成这个观测的输入数据集中相应观测组里id变量具有的最大值。,12,TTEST过程,对于配对设
5、计定量数据,我们可以采用TTEST过程进行统计分析。TTEST过程功能是对两组数据的均数进行差别比较的t检验,它的一般格式如下: proc ttest data= ;class 变量名称(分组变量);paired variables;var 变量名称(待分析的数值变量); by 变量名称(分组变量); run;,13,TTEST过程,PROC TTEST语句和CLASS(或PAIRED)语句是必需的,其余语句可以省略,CLASS语句、VAR语句及BY语句之间的顺序可以任意。CLASS语句所指定的分组变量是用来进行组间比较的,PAIRED语句专门用来进行配对t检验的数据分析,而BY语句所指定的分
6、组变量是用来将数据分为若干个更小的样本,以便SAS分别在各小样本内进行各自独立的处理。VAR语句引导所要进行比较的所有变量的列表,SAS将对VAR语句所引导的所有变量分别进行组间均数比较的t检验。,14,单样本t检验的基础理论,单样本t检验实际上是推断该样本来自的总体均数与已知的某一总体均数0(常为理论值或标准值) 有无差别。其检验统计量按下式计算,15,例题,某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?,16,SAS程序,直接计算法 PROC MEANS PR
7、OC UNIVARIATE PROC TTEST,17,配对设计资料t检验的基础理论,在医学研究中,常用配对设计。 异源配对 同源配对 自身前后设计,18,配对设计资料t检验的基础理论,配对t检验的实质同于单样本t检验,可将此类资料看成是差值 的样本均数所代表的未知总体均数 与已知总体均数 =0的比较,其检验统计量构造如下:,19,例题,两种方法对乳酸饮料中脂肪含量的测定结果(%),20,例题,计算检验统计量t:,21,SAS程序,PROC MEANS PROC UNIVARIATE PROC TTEST,22,两独立样本的t检验,在日常工作中,我们经常要比较某两组计量资料的均数间有无显著差别
8、,如研究不同疗法的降压效果或两种不同制剂对杀灭鼠体内钩虫的效果(条数)等。这时假若事先难以找到年龄、性别等条件完全一样的人(或动物)作配对比较,那么不能求每对的差数只能先算出各组的均数,然后进行比较。两组例数可以相等也可稍有出入。检验的方法同样是先假定两组相应的总体均数相等,看两组均数实际相差与此假设是否靠近,近则把相差看成抽样误差表现,远到一定界限则认为由抽样误差造成这样大的相差的可能性实在太小,拒绝假设而接受H1,作出两总体不相等的结论。,23,两独立样本t检验的基础理论,两样本t检验又称成组t检验,适用于完全随机设计两样本均数的比较,人们所关心的是两样本均数所代表的两总体均数是否不等。两
9、组完全随机设计是将受试对象完全随机分配到两个不同的处理组。 当两样本含量较小,且均来自正态总体时,要根据两总体方差是否不同而采用不同的检验方法。,24,总体方差相等的t检验,当两总体方差相等,可将两样本方差合并,求两者的共同方差合并方差 ,两样本t检验的检验统计量为,25,总体方差相等的t检验,26,近似t检验,Cochran & Cox的检验统计量为t,因t分布较复杂,故常利用t分布计算其近似临界值。Satterthwaite法 Welch法,27,例题,为了研究新药阿卡波糖胶囊的降血糖效果,某医院用40名型糖尿病病人进行同期随机对照试验。实验者将这些病人随机等分到实验组(阿卡波糖胶囊)和对
10、照组(拜唐苹胶囊),分别测得试验开始前和8周后的空腹血糖,算得空腹血糖下降值,能否认为该新药阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果不同?,28,例题,提出检验假设H0与备择假设H1:H0:1=2,阿卡波糖胶囊组与拜唐苹胶囊组空腹血糖下降值的总体均数相等;H1:12,阿卡波糖胶囊组与拜唐苹胶囊组空腹血糖下降值的总体均数不相等; 定显著性水准,并查出临界t值。现令=0.05, 计算检验统计量t: 实验组空腹血糖下降值均数=2.065 mmol/L,标准差S1=3.0601 mmol/L;对照组空腹血糖下降值均数=2.625 mmol/L,标准差S2=2.4205mmol/L;。,29,例题,
11、确定P值,作出推断结论:查t界值表得P0.50,所以检验假设H0得以接受, 无统计学意义。尚不能认为阿卡波糖胶囊组与拜唐苹胶囊组空腹血糖下降效果不同。,30,SAS程序,PROC TTEST Cochran & Cox Satterthwaite Welch,31,本章小节,介绍了单样本t检验的基础理论,并列举了单样本t检验分析实例means、univariate过程。以MEANS过程实现对单变量分布位置的t检验,只需在PROC MEANS语句后添加t和probt两个选项,SAS即给出样本均数与0比较的t检验值和t分布曲线下该t值对应的双侧尾部面积。UNIVARIATE过程在默认状态下即可给出单变量分布位置的t检验结果。,32,本章小节,介绍了配对设计资料t检验的基础理论,并列举了配对t检验分析实例means、univariate、ttest过程。 最后,本章介绍了两独立样本t检验的基础理论,并列举了独立样本t检验分析实例ttest过程应用。 需要强调的是,t检验的应用条件(正态分布和方差齐性),大家在采用t检验进行数据分析之前,应首先判断数据是否满足t检验的条件,然后再进行统计分析。,33,34,课后思考题,如何做单侧t检验?,35,