1、 教育统计学第一章 绪论一、什么是教育统计学:教育统计学是运用数理统计的原理和方法,研究教育问题的一门应用科学。主要任务是研究如何搜集、整理、分析由教育调查和教育试验所获得的数字资料,并以此为依据,进行科学推断,揭示教育现象所蕴含的客观规律。二、统计学的分类:描述统计 推断统计 理论统计 应用统计描述统计: 描述统计就是对已获得的数据进行整理、概括,显现其分布特征的统计方法.推断统计: 根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上,对总体分布特征进行估计、推测,这种统计方法称为推断统计。(内容:参数估计和假设检验 目的:对总体特征作出推断)三、具有以下三个特性的现象,称
2、为随机现象第一,一次试验有多种可能结果,其所有可能结果是已知的;第二,试验之前不能预料哪一种结果会出现;第三,在相同的条件下可以重复试验。(延迟满足)四、样本容量(样本包含的个体数目 大样本 n30 小样本 n30五、参数和统计量参数(parameter) 描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。 所关心的参数主要有总体均值( )、标准差( )、总体比例( )等 总体参数通常用希腊字母表示统计量(statistic) 用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数 所关心的样本统计量有样本均值(x )、样本标准差(s )、样本比例(p
3、)等 样本统计量通常用小写英文字母表示 参数与统计量的符号系统第二章 数据的处理一、名义、顺序、等距、比率名义变量:是指一事物与其他事物在属性、类别上不同。1 表示男,0 表示女,但这里的 1,0 并不说明事物间差异的大小,只是分类的符号而已,即名称变量不说明事物之间差别的大小,作比较时,只能说明被比事物相同,还是不同顺序变量(ordinal variable) 。顺序变量:是事物的某一属性的多少或大小按顺序排列起来的变量。如教师按能力大小或成绩高低排列等级:1,2,3,这一系列数据表明“大于”某某,即第 1高于第 2,第 2 高于第 3,而相邻两个等级的间隔是不等距的,即 1 与 2 和 2
4、 与 3 之间并不等距。只有等级上的差别,是一种既无相等单位又无绝对零点的变量。 等距变量:在能力测验或知识测验中,或甲生得 80 分,乙生得 60 分,进行比较时我们可以说甲生比乙生多 20 分,但却不能以倍数来表示。这是因为这类数据只具有相等的单位,而没有绝对的零点。这类变量虽然有 0 分,但是这个 0 分是人为确定的。譬如某一个学生在数学测验中得了 0 分,我们并不能说他不没有一点数学能力或知识,这就像摄氏温度一样,0 度并不意味着没有温度。比率变量:比率变量是一种既有相等的单位,又有绝对零点的变量,又称等比变量,像人的身高、体重、距离、时间、教育投资、学校固定资产金额等均属于这种变量。
5、第三章 集中量一、集中量的定义:代表一组数据典型水平或集中趋势的量称为集中量; 用途有二,一是可以作为一组数据的代表值;二是可以进行组与组之间的比较。常用的集中量有算术平均数、中位数、众数等。二、算术平均数的优缺点1.算术平均数:最常用,优点也最多。优点:(1)感应灵敏(2)严密确定(3)简明易懂,计算简便(4)适合代数运算(5)受抽样变动的影响较小缺点:(1)易受两极端数值的影响 (2)有一两个数据模糊不请时,无法计算。这时通常选择中位数。三、算术平均数计算:是所有观察值的总和除以总频数所得之商,简称平均数或均数、均值。NXX2四、中位数的算法总频数为奇数 如 n=25 为奇数,n+1/2=
6、26/2=13, 所以中位数为位于第 13 号的那个,总频数为偶数 中位数为第 15 号和 16 号数值的平均,即(88+89) 2=88.5。五、百分位数(概念):百份位数是位于以一定顺序(一般是由小到大)排列的一组数据中某一百分位置的数值。百分位通常用第几百分位来表示,如第五百分位,它表示在所有测量数据中,测量值的累计频次达 5%。以身高为例,身高分布的第五百分位表示有 5%的人的身高小于此测量值, 95%的身高大于此测量值。 例:P80=75 有 80%的人得分低于 75 p80=- 有 80%的人得分低于该分数六、众数的求法:先把数据列出来,然后找出现频数最大的数,即为众数第四章 差异
7、量一、差异量的定义:表示一组数据变异程度或离散程度的量称为差异量常用的差异量指标有:方差;标准差二、方差与标准差的优缺点:1.优点:反应灵敏;严密确定;适合代数计算;计算简单;用样本数据推断总体差异量时,方差和标准差是最好的估计量。一般和算术平均数结合在一起使用。2.缺点:不太容易理解;易受两极端数值的影响;有个别数值模糊时,无法计算;单位的平方不好理解。三、偏态量(skew):是描述次数分布的偏态方向和程度的量数。正偏态 负偏态当 SK=0 时分布呈对称形,当 SK0 时分布为正偏态,当 SK0 时分布为负偏态。SK 的绝对值越大,偏斜度越大。若偏态系数为正(S0) 表示成绩分布是正偏态,S
8、 越大,分数越集中在低分端;若偏态系数为负(S0) 表示成绩分布是负偏态,S 越大,分数越集中在高分端;考试难度大,学生得分普遍低,呈正偏态; 考试难度小,学生得分普遍高,呈负偏态. 高狭峰:S 较小,分数分布高窄,集中在平均数两侧。 低阔峰:S 较大,分数分布低阔,散布较广。 正态峰:分布介于高峰态和低峰态之间。第五章 参数估计一、推断统计:推断统计是研究如何利用样本数据来推断总体特征的统计方法。 点估计含义:直接用样本统计量的值作为总体参数的估计值,样本均值就是总体均值 的一个估计量。如果样本均值 x = 3 , 的估计值点估计的理论依据 1。对称分布的中位数与平均数重合,其样本平均数 就
9、是总体平均数和总体中位数的无偏估计量,也是一致估计量. 2。根据中心极限定理 ,只要样本容量足够大,就可以近似地用正态分布去描述它. 3。一般情况下,样本平均数是比样本中位数更有效的估计量 ,因为在大量样本中,样本平均数的平均误差比样本中位数的平均误差小.二、良好点估计量的条件 无偏性 一致性 有效性 区间估计:一定概率条件下样本统计量估计总体参数可能落入范围估计一个包含总体参数在内的区间,通常用区间的大小或者实际参数落在某个区间的概率两种方式表达区间估计的结果1. 根据一个样本的观察值给出总体参数的估计范围2. 给出总体参数落在这一区间的概率3.例如: 总体均值落在 5070 之间,置信度为
10、 95%1)置信区间定义:置信区间是指在特定的可靠性(即置信系数)要求下,估计总体参数所落的区间范围,亦即进行估计的全距。 置信区间的涵义:以 95%的可信区间为例,对于某一个区间而言,它包含总体均数的可能性为 95%,而不包含总体均数的可能性仅为 5%。因此在实际应用中,以这种方法估计总体均数犯错误的概率仅为 5%。 2)置信系数 (置信度 ) 定义:置信系数是指被估计的总体参数落在置信区间内的概率 D ,或以1-a 表示。置信系数是用来说明置信区间可靠程度的概率,也是进行正确估计的概率。 符号:D(Degree of reliability) ,或 1- 别名:置信水平、置信系数、置信概率
11、 常用值:D(1-)=.95 D(1-)=.99三、显著性水平:统计学中把这种拒绝零假设的概率,显著性水平是统计推断时,可能犯错误的概率。 值和可靠度之间的关系是:两者之和为 1。 值越大,可靠度就越低; 值越小,可靠度就越高。一个置信系数同时反映了在做出一个估计时所犯错误的小概率( ) ,即可靠性为 95%时,意味着犯错误的概率为 5%;可靠性为 99%时,意味着犯错误的概率为 1%。显著性检验的一般步骤:1.提出假设 2.选择检验统计量并计算其值 3.确定检验形式 4.统计决断双侧 Z 检验统计决断规则Z与临界值的比较 P 值 检验结果Z1.96 P0.05 不显著1.96 Z2.58 0
12、.01P 0.05 显著Z 2.58 P 0.01 极其显著单侧 Z 检验统计决断规则Z与临界值的比较 P 值 检验结果Z1.65 P0.05 不显著1.65 Z2.33 0.01P 0.05 显著*Z 2.33 P 0.01 极其显著*四、正态分布区间与横轴围成的面积为 1 五、假设检验的步骤A、提出原假设和备择假设 B、确定适当的检验统计量 C、规定显著性水平 D、计算检验统计量的值 E、作出统计决策第六章 平均数差异检验一、独立样本定义:两个样本内的个体是随机抽取的,它们之间不存在一一的对应关系。二、 两独立样本 T 检验:是根据样本数据对两个样本来自的两独立总体的均值是否有显著差异进行
13、推断。SPSS13.0 操作 :Analyzecompare meansIndependent samples T test 前提条件:1、两样本应该是相互独立的。2、样本来自的两个总体应该服从正态分布。 样本平均数与总体平均数之间差异的假设检验又叫做总体平均数的显著性检验。如果某个样本平均数与总体平均数的差异达到了显著性水平就可以推翻零假设,可以认为这个样本不是来自该总体,而是来自其他总体;如果这个样本平均数与总体平均数的差异未达到显著性水平,则要接受零假设,这时就得承认这个样本来自该总体。 将介绍如何由两个样本平均数之差检验两个相应总体平均数之差的显著性。如果某两个样本平均数之间的差异达到
14、了一定的限度,即达到了显著性水平,就可以认为这两个样本来自不同的总体,或者说,这两个样本各自所代表的总体之间有真正的差异;如果两个样本平均数之间的差异不显著,则可以认为,这两个样本平均数之间的差异是由抽样误差造成的,它们所来自的总体的平均数相等或就来自同一个总体。基本原理:与一个样本平均数与总体平均数差异的检验相同。首先对两个相应的总体平均数之间提出没有差异的虚无假设和有差异的备择假设,然后考察虚无假设成立的概率如何。如果概率较小,就拒绝虚无假设,接受备择假设,说明两个总体平均数差异显著;反之,则说明两个总体平均数差异不显著。 t 检验统计决断规则 t与临界值的比较 P 值 检验结果 tt(d
15、f)0.05 P0.05 不显著 t(df)0.05 t t(df)0.01 0.01P 0.05 显著 * t t(df)0.01 P 0.01 极其显著*三、配对样本的两种情况:(1)用同一测验对同一组被试在试验前后进行两次测验,所获得的两组测验结果是相关样本。 (2)根据某些条件基本相同的原则,把被试一一匹配成对,然后将每对被试随机地分入实验组和对照组,对两组被试施行不同的实验处理之后,用同一测验所获得的测验结果,也是相关样本。配对样本 T 检验:SPSS13.0 操作:Analyzecompare meanspaired samples T test 四、什么时候进行配对样本 t 检验
16、,什么时候进行独立样本 T 检验方差分析 一、方差分析的概念:方差分析是检验多个样本均数间差异是否具有统计意义的一种统计学方法。 单因素方差分析一、 定义:单因素方差分析测试摸一个控制变得不同水平是否给观察变量造成了显著差异和变动,例:培训是否给学生造成显著影响SPSS13.0 操作方法:Analyzecompare meansone-way ANOVAfactor 自变量 dependent list 因变量(1 各自变量,多个因变量)相关分析 一、相关的概念两个变量之间不精确、不稳定的变化关系称为相关关系。它与事物之间普遍存在的另外两种关系即因果关系和共变关系是不同的。 二、积差相关 :
17、当两个变量都是正态连续变量,两者之间呈线性关系时,表示这两个变量之间的相关。 三、点二列相关: 当两列变量中一个是正态连续变量,而另一个是真正的二分名义变量,表示这两个变量之间的相关,称为点二列相关 四、相关系数五、相关系数的取值范围相关系数的取值范围在1 和+1 之间,即1 r+1。其中: 若 0r 1,表明变量之间存在正相关关系,即两个变量的相随变动方向相同; 若1r0,表明变量之间存在负相关关系,即两个变量的相随变动方向相反; 六、解释正负值的意义Z 分数在一次测验中比较学生语文、数学、英语成绩(不同质的一般不能比较)要将数据转换为 Z 分数,可进行比较SPSS13.0 操作:Analy
18、ze descriptive statistics descriptive(选几个比较对象)同时点击 save standardize values as variable ok补充:一. 频数分布表.一般是从小到大.二. 正态曲线的特点:1. 曲线在 z=0 处为最高点。2. 曲线以 z=0 处为中心,双侧对称。3. 曲线以最高点向左右缓慢下降,并无限延伸,但永远不与基线相交。4. 标准正态分布上的平均数为 0,标准差为 1。基线上 z 从-3 到+3,6 个标准差之间的距离几乎含盖了全部的面积。 (99.73%)5. 曲线从最高点向左右延伸时,在正负 1 个标准差之内,既向下又向内弯;从正负 1 个标准差开始,既向下又向外弯。