1、统计学,从数据到结论,“骂人”背后的哲学我从来没有骂过人你骂过人否定一个事物是比较容易的,我从来没有骂过人(被怀疑)你骂过人原假设(零假设)备择假设,5.1 假设检验的基本步骤,归纳起来,假设检验的逻辑步骤为:1. 写出零假设和备选假设;2. 确定检验统计量;3. 确定显著性水平a;4. 根据数据计算检验统计量的实现值;5. 根据这个实现值计算p-值;6. 进行判断:如果p-值小于或等于a,就拒绝零假设,这时犯(第一类)错误的概率最多为a;如果p-值大于a,就不拒绝零假设,因为证据不足。,该市人均住房面积的平均值是否为20?,原假设:是20 备择假设:不是20检验统计量:t确定显著性水平:0.
2、05计算p值P0.05 拒绝 否则接受原假设,11.1比较平均数,比较平均数(compare means)是指一个变量(如性别)的类别(如男女)在定量(如事物有用性态度)上的平均数差异。单变量分析(univariate analysis)顾名思义就是针对单一的变量进行描述与假设检验,在分析这方面,研究者会用适当的技术针对样本做分析,均值比较的例子,产品样本重量均值和标准重比较清华和北大学生在学习能力上的比较减肥药的效果:减肥前后体重的比较,在SPSS中适合利用定量数据进行单变量假设检验的统计技术有Compare MeansMeansOne-Sample T TestIndependent-Sa
3、mple T TestPaired-Samples T TestOne-Way ANOVA,均值比较的例子,产品样本重量均值和标准重比较清华和北大学生在学习能力上的比较减肥药的效果:减肥前后体重的比较,11.2 样本均值与总体均值的比较单一样本T检验,SPSS单一样本T检验是检验某个变量的总体均值和某指定值之间是否存在显著差异。统计的前提样本总体服从正态分布。也就是说单样本本身无法比较,进行的是其均数与已知总体均数间的比较。,按照5%的显著性水平判断某班级学生的高考数学成绩和全国的平均成绩70之间是否存在显著差异。数据如下表:,SPSS中实现过程,实现步骤,“One-Sample T Test
4、”设置框,“One-Sample T Test:OPtions”对话框,结果与讨论,均值比较的例子,产品样本重量均值和标准重比较清华和北大学生在学习能力上的比较减肥药的效果:减肥前后体重的比较,11.3 成组设计两样本均值的比较两独立样本T检验,所谓独立样本是指两个样本之间彼此独立没有任何关联,两个独立样本各自接受相同的测量,研究者的主要目的是了解两个样本之间是否有显著差异存在。这个检验的前提如下:两个样本应是互相独立的,即从一总体中抽取一批样本对从另一总体中抽取一批样本没有任何影响,两组样本个案数目可以不同,个案顺序可以随意调整。样本来自的两个总体应该服从正态分布,具有方差齐性。,按照5%的
5、显著性水平分析A、B两所高校大一学生的高考数学成绩之间是否存在显著性差异。数据如下表所示:,SPSS中实现过程,实现步骤,“Independent-Samples T Test”对话框,“Define Groups”对话框,Use specified values(使用指定的数值)以“1”代表群组1(男性)以“2”代表群组2(女)若自变项为连续变量,则应选择Cut Point(分割点),并在其后的的方格内输入分组的临界数,也就是观察值如果小于分割点的话,就被分成一组;大于或等于分割点的观察值,就会被分到另外一组。,结果和讨论,独立样本T检验的前提两个样本均符合正态分布,具有方差齐性(homog
6、eneity of variance)。结果中先检验方差齐性:方差方程的Levene检验中其F值为0.571,显著性=0.4610.05,未达显著水平,故应接受方差齐性的原假设(原假设:两组的方差相等)。,结果和讨论,方差齐性:看结果第一行否则,结果看第二行进行判断,均值比较的例子,产品样本重量均值和标准重比较清华和北大学生在学习能力上的比较减肥药的效果:减肥前后体重的比较,11.4 配对设计样本均值的比较 两配对样本T检验,一般用于同一研究对象(或两配对对象)分别给予两种不同处理的效果比较,推断两种效果有无差别同一研究对象(或两配对对象)处理前后的效果比较。推断某种处理是否有效。两配对样本T
7、检验的前提要求如下:两个样本应是配对的。首先两个样本的观察数目相同,其次两样本的观察值顺序不能随意改变。样本来自的两个总体应服从正态分布。,研究一个班同学在参加了暑期数学、化学培训班后,学习成绩是否有显著变化。数据下表所示:,SPSS中实现过程,实现步骤,“Pared-Samples T Test”对话框,结果和讨论,例子一,为全面了解大连市市内四区常住人口的住房现状和需求情况,在大连市政府统一组织和市国土资源和房屋管理局牵头协调下,国家统计局大连调查队从2006年4月份至9月初,历时5个月完成了大连市市内四区居民住房状况及需求的调查工作并获取了相关问题的第一手数据资料。住房调查.sav该数据
8、资料包含行政区域(QY)、住用状态(ZYZT)、家庭人口数(RKS)、现住房的建筑面积(JZMJ)4个变量的6 952个观测。其中,行政区域(QY)与住用状态(ZYZT)为定类型变量,例子一,该数据资料包含行政区域(QY)、住用状态(ZYZT)、家庭人口数(RKS)、现住房的建筑面积(JZMJ)4个变量的6 952个观测。其中,行政区域(QY)与住用状态(ZYZT)为定类型变量大连市住房建设规划中明确提出:到2010年大连市市内四区常住人口的住房条件要达到人均居住建筑面积30平方米的目标。试根据此调查数据,判断大连市市内四区家庭的现住房面积是否已达到人均30平方米的建设目标,如果没有达到目标,
9、计算距离目标还有多大差距。,例子二,某对外汉语教学中心进行了一项汉语教学实验,同一年级的两个平行班参与了该实验。两个班分别采用两种不同的教学方式学习40个生字,其中一班采用的是集中识字的方式,即安排外国留学生在学习课文以前集中学习生字,然后再学习课文;二班采用的是分散识字的方式,即安排留学生一边学习课文一边学习生字。为了考察两种教学方式对生字读音的记忆效果是否有影响,教学效果是否有差异,分别从一班和二班随机抽取了20名学生,要求他们对40个学过的汉字进行注音,每注对一个得1分,注错不得分。,例子二,此数据包含学生编号(NUM)、成绩(SCORE)、班级(CLASS)3个变量的40个观测。其中,班级为定类型变量,一班的取值标签为1,二班的取值标签为2汉语学习.asv试根据此数据评价两种教学方式的优劣。,例子三,为研究某种减肥茶是否具有明显的减肥效果,某健身机构对35名肥胖志愿者进行了减肥效果跟踪调研。首先,将其喝减肥茶以前的体重记录下来,三个月后再依次将这35名志愿者喝茶后的体重记录下来。该数据集包含喝茶前体重(hcq)、喝茶后体重(hch)两个变量的35个观测。每个观测的两个变量下的观测值都是出自同一个被测试者减肥茶效果鉴定.sav试通过这两组数据的对比分析,推断减肥茶是否具有明显的减肥效果。,结 束,