1、现代意义上的统计指的是对与随机现象有关的数据资料进行收集、整理、计算和分析的过程。心理与教育统计学就是用统计学的原理和方法来研究心理与教育现象,对有关的数字资料进行收集、整理、计算、分析的一门基础学科。心理与教育科学研究数据与结果多用数字形式呈现 研究数据具有随机性和变异性规律性。研究的目标是通过部分数据来推测总体特征。心理与教育统计使我们能以最少的样本含量,达到我们所需要的精确度,对总体的有关参数等作出判断,同时又给出发生错误的可能性。它保证了科学研究的精确性、可靠性和经济性。 统计学的理论基础是概率论与正态分布曲线方程的产生。发展经历了两个阶段:描述统计阶段(高尔顿 皮尔逊)和推论统计阶段
2、(格赛特 费舍尔)最初应用统计方法于教育与心理方面研究的是高尔顿 对教育统计做出重要贡献的是心理学家斯皮尔曼意义:学习心理与教育专业的诸课程需要统计学知识。从事心理与教育工作的实践需要统计学知识。进行心理教育科学研究需要统计学知识。科学的思维需要统计学知识。 对已获得的数据进行整理、概括,显现其分布特征的统计方法,称为描述统计。目的是将大量零散的、杂乱无序的数字资料进行整理、归纳、简缩、概括,使事物的全貌及其分布特征清晰、明确地显现出来。根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上,对总体分布特征进行估计、推测,这种统计方法称为推论统计。推论统计的内容包括总体参数估计和
3、假设检验两部分。推论统计的目的在于根据已知的情况,在一定概率的意义上估计、推测未知的情况。实验者为了揭示实验中自变量与因变量之间的关系,在实验之前所制订的实验计划,称为实验设计。不符合要求的数据主要有三种:缺失、可疑、失误对于个别极端数据是否该剔除,应遵循三个标准差法则数据分组的标志性质类别:按事物的不同性质进行分类。数量类别:按数值大小进行分类,并排序。 简单表:只按研究现象(或变量)的名称、地点、时序等列出数据的统计表。分组表:只按一个标志分组的统计表称为分组表。复合表:按两个或两个以上标志分组的统计表称为复合表。 统计图一般由图号、标题、标目、图形、图注等几部分构成。统计图中的标目由基线
4、和尺度线构成。对于有纵、横轴的统计图,一般以基线表示被观察的现象,而尺度线则表示其数量。 线形图用来表示连续型资料。它能表示两个变量之间的函数关系;一种事物随另一种事物变化的情况;某种事物随时间推移的发展趋势等编制分组次数分布表的步骤求全距 R=Xmax-Xmin决定组距 i 和组数 k 列出分组区间 登记次数计算每组数据的次数f 抄录新表在编制次数分布表的基础上,可以绘制次数分布图,使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。直方图 是以矩形的面积表示连续性随机变量次数分布的图形。一般用纵轴表示数据的频数,用横轴表示数据的等距分组点,即各分组区间的上下限。
5、算术平均数具备一个良好的集中量所应具备的一些特点:反应灵敏、有公式严密确定、简明易懂、适合代数运算等等,因此是一个最常用的集中量。主要不足:容易受两极端数值的影响;一组数据中有模糊不清的数值时无法计算。中位数不受两端极端数据的影响,但反应不灵敏,也不适合进一步代数运算的要求。一般用于下列情况:一组数据中有极端数据时;一组数据中有个别数据不确切、不清楚时;资料属于等级性质时。理论众数(公式法)是指与频数分布曲线最高点相对应的横坐标上的一点;粗略众数(观察法)是一组数据中出现次数最多的那个数众数的概念简单易懂,但比较粗略,不能灵敏地反映一组数据的变化,而且不适合进一步代数运算。一般用于类别变量或等
6、级变量的资料。描述数据离散程度的统计量称为差异量。差异量越大,表明数据越分散、不集中;差异量越小,表明数据越集中,变动范围越小。方差是表示一组数据离散程度的统计指标。一般样本的方差用 表示,总体的方差用 表示。标准差是方差的算术平方根。方差与标准差是表示一组数据离散程度的最好指标,是统计分析中最常用的差异量。标准差具备一个良好的差异量应具备的条件,如:反应灵敏,有公式严密确定,简明易懂,适合代数运算等等。应用方差和标准差表示一组数据的离散程度,须注意必须是同一类数据(即同一种测量工具的测量结果),而且被比较样本的水平比较接近。比较不同单位资料的差异程度 比较单位相同而平均数相差较大的两组资料的
7、差异程度可判断特殊差异情况 根据经验,一般CV值常在535之间。如果CV大于35时,可怀疑所求得的平均数是否失去了意义;如果CV小于5时,可怀疑平均数与标准差是否计算有误。 差异系数主要应用于平均数不等于零的连续数据。标准分数从分数对平均数的相对地位、该组分数的离中趋势两个方面来表示原始分数的地位。分数可以表明原始分数在团体中的相对位置,因此称为相对位置量数。分数无实际单位,是以平均数为参照点、以标准差为单位的相对量。 一组原始分数得到的分数既有正值,也有负值,所有原始分数的分数之和为零。 一组原始数据中,各个分数的标准差为。优点:可比性:标准分数以团体的平均数为基准,以标准差为单位,因而具有
8、可比性。可加性:标准分数使不同的原始分数具有相同的参照点,因而具有可加性。明确性:标准分数较原始分数的意义更为明确。合理性:标准分数保证了不同性质的分数在总分数中的权重相同,使分数更合理地反映事实应用:用于比较几个分属性质不同的观测值在各自数据分布中相对位置的高低。 计算不同质的观测值的总和或平均值,以表示在团体中的相对位置。 当研究需要合成不同质的数据时,如果已知这些不同质的观测值的次数分布为正态,这时可采用分数来计算不同质的观测值的总和或平均值。概率分布是指对随机变量取不同值时的概率的描述,一般用概率分布函数进行描述依随机变量的类型,可将概率分布分为离散型概率分布与连续型概率分布。心理与教
9、育统计学中最常用的离散型分布是二项分布,最常用的连续型分布是正态分布。 经验分布是指根据观察或实验所获得的数据而编制的次数分布或相对频率分布。理论分布是按某种数学模型计算出的概率分布。 基本随机变量分布是随机变量各种不同取值情况的概率分布,抽样分布是从同一总体内抽取的不同样本的统计量的概率分布以成功事件出现的次数为横坐标,以成功事件出现不同次数的概率为纵坐标,绘制直方图或多边图,即为二项分布图。二项分布是离散型分布,其概率直方图是跃阶式。 从概率直方图可以看到,二项分布有如下性质:当p=q时,图形是对称的当pq时,直方图呈偏态。pq与pq时的偏斜方向相反。二项分布函数除了用来求成功事件恰好出现
10、X次的概率之外,在教育中主要用来判断试验结果的机遇性与真实性的界限。 概率:当n无限增大时,随机事件A的频率会稳定在一个常数P,这个常数就是随机事件A的概率。概率的加法定理 若事件发生,则事件就一定不发生,这样的两个事件为互不相容事件。两互不相容事件和的概率,等于这两个事件概率之和乘法定理若事件发生不影响事件是否发生,这样的两个事件为互相独立事件。两个互相独立事件积的概率,等于这两个事件概率的乘积标准正态分布曲线特点曲线在处达到最高点曲线以处为中心,双侧对称曲线从最高点向左右缓慢下降,向两侧无限延伸,但永不与基线相交。标准正态分布曲线的平均数为,标准差为。从3至3之间几乎分布着全部数据。曲线的
11、拐点为正负一个标准差处。求0至某一值之间的概率:直接查表求两个值之间的概率两值符号相同:PZ1Z2PZ2PZ1两值符号相反:PZ1Z2PZ2PZ1求某一Z值以上的概率Z0时,PZ0.5PZ Z0时,PZ0.5PZ求某一Z值以下的概率Z0时,PZ0.5PZ Z0时,PZ0.5PZ采用标准分数特点:标准分的大小,既表明考生水平的高低,也表明该生在考生团体中的位置的高低。各科标准分都表示考生各科在同一团体中的位置,可根据标准分大小直接比较考生的各科成绩水平。各科标准分的参照点(平均分为500分)和单位(1个标准差为100分)都一样,具有可加性,克服了原始分的缺陷。区分三种不同性质的分布:总体分布:总
12、体内个体数值的频数分布 样本分布:样本内个体数值的频数分布 抽样分布:某一种统计量的概率分布抽样分布是从同一总体内抽取的不同样本的统计量的概率分布。从总体中随机抽出容量为n的一切可能样本的平均数之平均数等于总体的平均数容量为n的平均数在抽样分布上的标准差(即平均数的标准误),等于总体标准差除以n的算术平方根从正态总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态分布虽然总体不呈正态分布,如果样本容量较大,反映总体和的样本平均数的抽样分布,也接近于正态分布。标准误用来衡量抽样误差。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大
13、。因此,标准误是统计推断可靠性的指标平均数的抽样分布:由样本的平均数对总体平均数进行估计,首先要了解平均数的抽样分布,才能根据一定的概率,由样本的平均数对总体的平均数做出估计。无论样本容量大小,一切样本平均数的标准分数呈正态分布。T分布特点:形状与正态分布曲线相似t分布曲线随自由度不同而有一簇曲线自由度是指能够独立变化的数据个数查t分布表时,需根据自由度及相应的显著性水平,并要注意是单侧数据还是双侧。样本容量增大后,平均数的抽样分布接近于正态分布,可用正态分布近似处理:由样本的标准差估计总体的标准差即为点估计;而由样本的平均数估计总体平均数的取值范围则为区间估计。良好的点估计:无偏性 如果一切
14、可能个样本统计量的值与总体参数值偏差的平均值为0,这种统计量就是总体参数的无偏估计量。有效性 当总体参数不止有一种无偏估计量时,某一种估计量的一切可能样本值的方差小者为有效性高,方差大者为有效性低 一致性 当样本容量无限增大时,估计量的值能越来越接近它所估计的总体参数值,这种估计是总体参数一致性估计量 充分性 一个容量为n的样本统计量,应能充分地反映全部n个数据所反映的总体的信息。以样本统计量的抽样分布(概率分布)为理论依据,按一定概率的要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。对总体参数值进行区间估计,就是要在一定可靠度上求出总体参数的置信区间的上下限。要知道与
15、所要估计的参数相对应的样本统计量的值,以及样本统计量的理论分布;要求出该种统计量的标准误要确定在多大的可靠度上对总体参数作估计,再通过某种理论概率分布表,找出与某种可靠度相对应的该分布横轴上记分的临界值,才能计算出总体参数的置信区间的上下限。 置信度,即置信概率,是作出某种推断时正确的可能性(概率)。置信区间,也称置信间距(confidence interval,CI)是指在某一置信度时,总体参数所在的区域距离或区域长度。置信区间是带有置信概率的取值区间。显著性水平(significance level)就是指估计总体参数落在某一区间时,可能犯错误的概率,用符号表示。P-通过样本的平均数估计总
16、体的平均数,首先假定该样本是随机取自一个正态分布的母总体(或非正态总体中的n30的样本),而计算出来的实际平均数是无数容量为n的样本平均数中的一个。根据样本平均数的分布理论,可以对总体平均数进行估计,并以概率说明其正确的可能性。1总体平均数区间估计的基本步骤根据样本的数据,计算样本的平均数和标准差;计算平均数抽样分布的标准误;确定置信概率或显著性水平;根据样本平均数的抽样分布确定查何种统计表;计算置信区间;解释总体平均数的置信区间。利用样本信息,根据一定概率,对总体参数或分布的某一假设作出拒绝或保留的决断,称为假设检验。假设检验一般有两互相对立的假设。H0:零假设,或称原假设、虚无假设、解消假
17、设;是要检验的对象之间没有差异的假设。H1:备择假设,或称研究假设、对立假设;是与零假设相对立的假设,即存在差异的假设。进行假设检验时,一般是从零假设出发,以样本与总体无差异的条件计算统计量的值,并分析计算结果在抽样分布上的概率,根据相应的概率判断应接受零假设、拒绝研究假设还是拒绝零假设、接受研究假设。当概率足够小时,可以作为从实际可能性上,把零假设加以否定的理由。因为根据这个原理认为:在随机抽样的条件下,一次实验竟然抽到与总体参数值有这么大差异的样本,可能性是极小的,实际中是罕见的,几乎是不可能的。统计学中把拒绝零假设的概率称为显著性水平,用表示。显著性水平也是进行统计推断时,可能犯错误的概
18、率。常用的显著性水平有两个:0.05 和 0.01。 在抽样分布曲线上,显著性水平既可以放在曲线的一端(单侧检验),也可以分在曲线的两端(双侧检验)。为了将两种错误同时控制在相对最小的程度,研究者往往通过选择适当的显著性水平而对错误进行控制,如0.05或0.01。对错误,则一方面使样本容量增大,另一方面采用合理的检验形式(即单侧检验或双侧检验)来使误差得到控制。在确定检验形式时,凡是检验是否与假设的总体一致的假设检验,被分散在概率分布曲线的两端,因此称为双侧检验。双侧检验的假设形式为:H0:0, H1:0凡是检验大于或小于某一特定条件的假设检验,是在概率分布曲线的一端,因此称为单侧检验。单侧检
19、验的假设形式为:H0:0,H1:0或者 H0:0,H1:0一个完整的假设检验过程,一般经过四个主要步骤:提出假设选择检验统计量并计算统计量的值确定显著性水平做出统计结论总体平均数的显著性检验是指对样本平均数与总体平均数之间的差异进行的显著性检验。若检验的结果差异显著,可以认为该样本不是来自当前的总体,而来自另一个、与当前总体存在显著差异的总体。即,该样本与当前的总体不一致。检验的思路是:假定研究样本是从平均数为的总体随机抽取的,而目标总体的平均数为0,检验与0之间是否存在差异。如果差异显著,可以认为研究样本的总体不是平均数为0的总体,也就是说,研究样本不是来自平均数为0的总体。 一个完整的假设
20、检验过程,一般经过四个主要步骤:提出假设选择检验统计量并计算统计量的值确定显著性水平做出统计结论双侧检验的假设形式为:H0:0, H1:0单侧检验的假设形式为:H0:0,H1:0 (左侧检验)或者 H0:0,H1:0 (右侧检验)两个样本的数据之间存在着一一对应的关系时,称两样本为相关样本。常见的情形主要包括三种:一是同一组被试在前后两次在同一个测验上的结果;二是同一组被试分别接受两种不同实验的测验结果;三是按条件相同的原则选择的配对实验结果。对于方差不齐性的独立小样本,平均数差异的显著性可能由两方面的原因造成:一是两平均数确实存在显著差异;二是两总体方差之间存在显著差异。当两总体的方差之间差
21、异显著时,运用一般的t检验不准确,需要进行特别的检验。 方差齐性检验是对两总体方差是否齐性(即是否一致或是否存在显著性差异)进行的检验。方差齐性检验的统计量是,其概率分布遵循分布。若从方差相同的两个正态总体中,随机抽取两个独立样本,以此为基础,分别求出两个相应总体方差的估计值,这两个总体方差的估计值的比值称为F比值,其计算公式为方差分析通过对多组平均数的差异进行显著性检验,分析实验数据中不同来源的变异对总变异影响的大小。 方差分析作为一种统计方法,是把实验数据的总变异分解为若干个不同来源的分量。因而它所依据的基本原理是变异的可加性。在统计分析中,一般用方差来描述变量的变异性。 方差分析是将总平
22、方和分解为几个不同来源的平方和(实验数据与平均数离差的平方和)。然后分别计算不同来源的方差,并计算方差的比值即值。根据值是否显著对几组数据的差异是否显著作出判断提出假设选择检验统计量并计算 分解平方和SS分解自由度df 计算方差MS 计算F值作出统计结论并列方差分析表 条件总体正态分布各实验处理是随机的且相互独立(一般情况下都能满足)各实验处理内方差一致(需要进行检验)实验中的自变量称为因素。只有一个自变量的实验称为单因素实验,两个或两个以上称为多因素实验。某一因素的不同情况称为因素的“水平”。水平包括量差或质别两类情况,按各个“水平”条件进行的重复实验称为各种实验处理。 为了检验某一个因素多
23、种不同水平间差异的显著性,将从同一个总体中随机抽取的被试,再随机地分入各实验组,施以各种不同的实验处理之后,用方差分析法对这多个独立样本平均数差异的显著性进行检验,称为完全随机设计的方差分析。完全随机设计的方差分析中,把各种变异的总和称为总变异,并把总变异分成两部分:一部分称为组间变异,是在不同实验组之间表现出来的差异;另一部分称为组内变异,是在同一实验组内部不同被试之间表现出来的差异。 在实验的结果中,如果组内的差异较大,而组间的差异较小,表明几种不同的实验处理在效果上并没有明显的差别。如果组间的差异较大,而组内的差异较小则说明几种不同的实验处理在效果上表现出明显的差别。 完全随机的方差分析
24、步骤分解平方和 分解自由度3 计算方差4计算F值5查F表进行F检验并作出决断6陈列方差分析表1. 相关的概念 两个变量之间不精确、不稳定的变化关系,称为相关关系。两个变量之间的变化关系,既表现在变化方向上,又表现在密切程度上。正相关:两个变量的变化方向相同。负相关:两个变量的变化方向相反。零相关:两个变量的变化方向无一定规律。完全相关:两个变量的变化程度完全一致。强相关:两个变量变化的一致性比较强。中等相关:两个变量变化的一致程度中等。弱相关:两个变量变化的一致性比较差。完全不相关:两个变量变化程度没有一致性。1、积差相关及其适用条件积差相关是英国统计学家皮尔逊于20世纪初提出的一种计算相关的
25、方法,因而被称为皮尔逊积差相关,也称为积矩相关。积差相关适用于:两个变量都是连续数据;两变量总体都为正态分布;两变量之间为线性关系。成对数据,样本容量要大。连续变量:根据得到数据的方式判断,测量数据。正态分布一般情况下,正常人群的身高、体重、智力水平、心理与教育测验的结果,都可按总体正态分布对待;如果要求比较高,则需要对数据进行正态性检验。线性关系 根据相关散布图可判断两个变量之间是否线性关系。等级相关是指以等级次序排列或以等级次序表示的变量之间的相关。主要包括斯皮尔曼二列级相关和肯德尔和谐系数多列等级相关。 斯皮尔曼等级相关是等级相关的一种。它适用于两个以等级次序表示的变量,并不要求两个变量
26、总体呈正态分布,也不要求样本的容量必须大于30。当连续数据不能满足计算积差相关的条件时,可以转换成等级数据从而计算斯皮尔曼等级相关系数。适用条件一个变量为正态、连续变量,另一个变量为真正的二分名义变量,这两个变量之间的相关,称为点二列相关有时一个变量并非真正的二分变量,而是双峰分布的变量,也可以用点二列相关来表示。 两个变量都是正态连续变量,其中一个变量被人为地划分成二分变量,表示这两个变量之间的相关,称为二列相关 将连续变量人为划分为二分变量时,应注意尽量使分界点接近平均数。两个变量都是按性质划分成几种类别,表示这两个变量之间的相关称为品质相关。品质相关处理的一般是计数数据而不是连续数据,主
27、要用于双向表或称为列联表(RC表)。品质相关的方法有多种,最常用的是相关和列联相关。当两个变量均被分成两个以上类别,或其中一个变量被分成两个以上类别,表示这两个变量之间的相关,称为列联相关。列联相关系数是由的列联表求得的,因此称为列联相关。最常用的是皮尔逊定义的列联相关系数。相关系数的显著性检验即样本相关系数与总体相关系数的差异检验。包括两种情况: =0和=0对=0的检验是确认相关系数是否显著;对=0的检验是确认样本所代表的总体的相关系数是否为0 。将存在相关的两个变量,一个作为自变量,另一个作为因变量,并把二者之间不十分准确、稳定的关系,用数学方程式来表达,则可利用该方程由自变量的值来估计、
28、预测因变量的估计值,这一过程称为回归分析 。 回归表示一个变量随另一个变量作不同程度变化的单向关系。 相关与回归是从不同角度对变量间关系的分析:相关关系是两个变量之间的双向关系,没有主从之分;而回归关系是两个变量之间的单向关系,是自变量对因变量的影响关系。相关关系用相关系数来表示,而回归关系用数学模型来表示,这种数学模型称为回归方程常用的拟合这条回归线的原则,就是使各点与该线纵向距离的平方和最小,也就是使误差的平方和最小。这种求回归系数的方法称为最小二乘法。最小二乘法得到的是可能的各条直线中拟合最好的一条。线性回归基本假设:1两变量呈线性关系 2因变量的分布为正态 3独立性假设 4方差齐性假设
29、 1一元线性回归方程的检验的意义根据样本数据计算出的回归方程可能有一定的抽样误差。为了考查这两个变量在总体内是否存在线性关系,以及回归方程对估计预测因变量的有效性如何,在回归方程应用之前,首先应进行显著性检验。 有三种等效的方法 对回归方程进行方差分析 对两个变量的相关系数进行总体零相关的显著性检验 对回归系数进行显著性检验 1抽样设计的意义 使研究节省人力及费用使研究节省时间,提高时效性;保证研究结果的准确性。 分层随机取样法的优点是代表性和推论的精确性较好。它适用于总体单位数量较多,并且内部差异较大的研究对象。分层随机取样法的局限性是要求对总体各单位的情况有较多的了解,否则就难以作出科学的分类。 整群随机取样法的优点是样本比较集中,适宜于某些特定的研究,尤其是在教育实验中常用此法。此外,在规模较大的调查研究中,整群随机取样易于组织,可节省人力、物力和时间。整群随机抽样法的缺点是样本分布不均匀,代表性较差。