收藏 分享(赏)

cyu__中科院心理统计.doc

上传人:dreamzhangning 文档编号:3007741 上传时间:2018-10-01 格式:DOC 页数:23 大小:442.50KB
下载 相关 举报
cyu__中科院心理统计.doc_第1页
第1页 / 共23页
cyu__中科院心理统计.doc_第2页
第2页 / 共23页
cyu__中科院心理统计.doc_第3页
第3页 / 共23页
cyu__中科院心理统计.doc_第4页
第4页 / 共23页
cyu__中科院心理统计.doc_第5页
第5页 / 共23页
点击查看更多>>
资源描述

1、心理统计=陈毅文中国科学院心理研究所社会与经济行为研究中心心理统计 描述统计 描述统计学主要研究如何整理科学实验或调查得来的大量数据,通过图表的形式描述一组数据的全貌,并计算出一些统计特征 推断统计 推断统计学是研究如何根据样本数据去推断总体数量特征的方法。它是在对样本数据进行描述的基础上,对统计总体的未知数量特征作出以概率形式表达的推断。 描述统计 统计图表 集中量数 差异量数 相对量数 相关量数1-1、统计图表 数据分组:单变量值分组、组距分组 次数分布表:次数、累积次数、相对次数、累积相对次数、百分比、累积百分比 统计图:条形图、圆形图、累积次数分布图、累积百分比图、直方图、次数多边形图

2、、散点图、线形图1-2、集中量数 平均数 算术平均数 加权平均数 几何平均数 调和平均数 众数 中数算术平均数 总体平均数 NXXii121 样本平均数nXnXnii121算术平均数的性质算术平均数主要适用于等距以上数据,但不适用于类别数据和顺序数据。优点是反应灵敏、计算简单、符合代数方法进一步演算、较少受抽样变动的影响;缺点是易受极端值的影响;niiniinii XcXcdXcYdcXYc12121.5;0.4;,3; , .2; c, .1即平 均 数 的 离 差 平 方 和 , 于 观 测 值 与的 离 差 平 方 和 大 于 或 等观 测 值 与 任 意 常 数 总 和 为 零 , 即

3、观 测 值 与 平 均 数 的 离 差则若 则有若 两 个 随 机 变 量 则有若 两 个 随 机 变 量加权平均数:用于分组数据1、组距分组数据设原始数据被分成K组,各组的组中值分别为X 1,X 2,X K,各组变量值出现的频数分别为F 1,F 2,F K,则均值为:2、单变量值分组几何平均数调和平均数众数众数是一组数据中出现次数最多的变量值。用Mo表示,它是一个位置代表值,主要用于测度定类数据的集中趋势,也适用于定序、定距和定比数据的集中趋势的测度值。优点是不受极端值的影响,缺点是可能不唯一中数 中数也叫中位数,是一组数据中按从小到大排序后,处于中间位置上的变量值。它将全部数据分成两部分,

4、每个部分各包含50%的数据。 中位数是一个位置代表值,它主要用于测度顺序数据的集中趋势。也适用于等距以上数据。但不适用于类别数据。 将全部数据排序后,如果项数是奇数,则正中央的那一项即为中位数;如果项数是偶数,则正中央的那两项的平均值即为中位数。1-3、差异量数KX21KknnX21 nMXG21121nXn 离差与平均差 方差与标准差 变异系数离差与平均差离差:也叫离均差, X- i或i平均差:也称平均离差,是各变量值与其均值离差绝对值的平均数,用M D表示。计算公式为: NXii1方差与标准差方差是各变量值与其均值离差平方和的平均数,是测度等距以上数据离散程度的最主要方法。标准差是方差的平

5、方根 nX-XSN-)-(2n1iin1i2in1i2i 21ii1i2iN12i 样 本总 体 iS总体方差和标准差 21 2112122 NXNXii iiNiiNii2112NXiiNii样本方差与标准差 1,111212 21221222 nXS nXnXnSniinii niiniiniiniinii方差、标准差的性质:(1)若 y=x+c , x和y是随机变量,c为常数,则 xy2(2)若 y=cx, c为常数 , 则 xy22样本方差与总体方差的区别:(1)在计算上,总体方差是用数据个数或总频数去除离差平方和,而样本方差则用样本数据个数或总频数减一去除离差平方和;(2)样本方差是

6、统计量,用S 2表示;总体方差是总体参数,用 2表示。(3)当 n很大时,S 2与 2相差很小,前者是后者的无偏估计。变异系数 也称离散系数,标准差系数,是一组数据的标准差与其相应的均值之比。 变异系数指出了标准差相对于平均值的大小,用于比较不同总体或样本数据的离散程度。 变异系数可用于同一团体不同测量的变异的比较,也可用于不同团体同一测量的变异的比较。 XSCV1-4 相对量数 百分位数 百分等级 标准分数百分位数次数分布中对应于某个特定百分点的原始分数。第m百分位是这样一个值,它使得至少有m%的数据小于或等于这个值,且至少有(100-m)%的数据项大于或等于这个值。 L-FPfmifFN1

7、0LPbb的 累 积 次 数 ;小 于所 在 组 的 次 数 ;所 在 组 的 下 限 ;个 百 分 位 分 数 ;第其 中 :百 分 位 分 数 计 算 公 式 :百分等级分数次数分布中低于某个原始分数的次数百分比,用PR表示。求百分位分数是先确定某个百分点m,然后去求相应的百分位分数P m 。而求百分等级分数正好相反,事先知道次数分布中的一个原始分数,再求该分数在分布中所处的相对位置。 -i LF -f PR10NifL-xFbb组 距 。 的 累 积 次 数 ;小 于组 的 次 数 ;某 特 定 原 始 变 量 所 在组 的 下 限 ;某 特 定 原 始 变 量 所 在百 分 等 级 分

8、 数 ;其 中 : :百 分 等 级 分 数 计 算 公 式标准分数标准分数也叫Z分数,它是以标准差为单位,可以给出一个原始分数在一组数据中的相对位置。 SXZiiZ分数的应用: 比较分属性质不同的观测值在各自数据分布中相对位置的高低。 当已知各不同质的观测值的次数分布为正态时,可用Z分数求不同的观测值的总和或平均值,以表明在总体中的位置。 表示标准测验分数 z=az+b 异常值(极端值) 的取舍 由标准分数可以计算出原始分数x=+z相关量数 积差相关 等级相关 肯德尔和谐系数 点二列相关 二列相关 相关相关 相关的含义 正相关、负相关和零相关 相关系数 如何通过散点图直观地判断两个变量的相关

9、 计算相关系数时应该注意的问题 相关系数受样本容量n的影响,样本相关系数需要检验 存在相关关系不一定存在因果关系 没有线性相关,不一定没有关系,可能是非线性的。积差相关 适用条件:两变量等距、正态并且具有线性关系 nYnXYYXrniiniiiii 22221212斯皮尔曼等级相关 适用条件 顺序量表的数据 等距、等比数据而总体非正态 优缺点 对总体没有特别要求,适用面广 与积差相关相比,精度稍差 )1(62nDrniiR肯德尔和谐系数适合于k个评价者对n个被评价事物进行等级评价的资料。 计算评价者一致性系数 nkRnkRWniinini 32132121点二列相关 适用资料:两列变量中一列为

10、等距或等比的测量数据而且总体分布为正态,另一列变量为类别(名义)变量,分为两类 可用于判别是非选择测验题目的区分度 计算公式 pqSXrtpb二列相关 适用于两列变量都为正态等距变量,但其中一列变量被人为地划分成两类。 二列相关与点二列相关的主要区别在于二分变量是否正态 ypqSXrtpb 相关 相关的适用资料是除四分相关之外的四格表资料,是表示两二分变量相关程度最常用的一种相关系数。 系 数 显 著 。则检 验 显 著若 , ,22 dbcabdn推断统计 推断统计基础 参数估计 假设检验 方差分析 回归分析 卡方检验 非参数检验2-1 推断统计基础 概率基础 正态分布 二项分布 抽样原理与

11、抽样方法 抽样分布1、概率基础 试验与事件 事件的概率定义 常用排列组合公式 概率的性质与运算法则 条件概率与独立事件 加法公式、乘法公式常用排列组合公式:概率的性质与运算法则 1, )2nm( ,1()!,1)( ,)!()(01nnmnmnCPmnCnP时 用 此 公 式当概率的性质与运算法则 概率的性质 非负性。对任意事件 A, 0 P(A) 1 规范性。必然事件的概率为 1,不可能事件的概率为0。P()1,P()0 可加性。若 A,B 互斥,则 P(AB)P(A)P(B) 概率运算 () ( A) 加法公式: P( AB)P(A) P(B)P(AB)条件概率与独立事件条件概率:当某一事

12、件 B 已知发生时,求事件 A 发生的概率,称为事件 B 发生条件下事件 A 发生的条件概率,记为 P(A|B)。 )(|()()|P(乘法公式:P(AB)=P(B)P(A|B)P(AB)=P(A)P(B|A)独立事件 两个事件中不论哪个事件发生与否并不影响另一个事件发生的概率,称这两个事件相互独立。 两个事件A、B是相互独立的,当且仅当,P(AB)=P(A)P(B) 独立事件与相斥事件的区别2、正态分布 一般正态分布的图形特点 标准正态分布 一般正态分布的标准化转换 标准正态分布表及其应用图形特点1) f(x)0,整个密度函数都在x轴的上方;2)曲线对称,平均数,中数,众数三者相等,x= 处

13、达到最大值3)曲线的陡缓程度由决定, 越大,曲线越平缓 ; 越小,曲线越陡峭。X趋向于无穷时,曲线以x轴为其渐近线。4)正态曲线下面的面积为1,平均数左右各为0.5;5)正态分布曲线下,标准差与概率(面积) 有一定的关系: 1 内,概率为0.6826;2内,概率为0.9545;3内,概率为0.9973标准正态分布=0, =1时,有相应的正态分布N(0,1)称为标准正态分布(Standard normal distribution). 通常用(x)表示概率密度函数。任何一个一般的正态分布都可以通过线性变换转化为标准正态分布. )1,0(,2NXZ正态分布表即:标准正态分布函数(x) 的数值表;将

14、一般正态分布化为标准正态分布,通过查表可解决正态分布的概率计算问题。使用正态分布表可作如下计算:1)依据 Z 分数求概率 ; 如 Z=1 时,p=0.34132)知道概率求 Z 分数;如 p=0.2517 时,Z=0.683)已知概率或 Z 分数, 求概率密度值 f(x)4)知道 Z 分数,求原始分数,x=.+Z3、二项分布 二项分布的定义及满足的条件 二项分布的概率计算公式 二项分布的总体均值与方差 用二项分布解决实际问题二项分布的定义及满足的条件1)试验中包含了n个相同的试验;2)每一次试验只有两个可能的结果,“成功” 和“ 失败”;3)出现 “ 成功”的概率p是相同的,“失败”的概率q也

15、不变;p+q=14)试验是相互独立的。符合上述条件的n次重复独立的试验为n重贝努里试验(Bernoulli trials)或二项试验。二项分布的概率计算公式X 表示 n 次重复独立试验中事件 A(成功)出现的次数nxqpCxPn,210,二项分布的期望值和方差E(X) npD(X)=npq4、抽样原理与抽样方法 总体、个体、样本、样本容量 参数与统计量的区别和联系,常见的参数与对应的统计量。 几种抽样方法:简单随机抽样、分层抽样、整群抽样、系统抽样5、抽样分布 抽样分布的含义 样本均值分布及其中心极限定理 几种常见的抽样分布:样本均值分布、样本方差的分布、样本方差比的分布 几种常见的理论分布:

16、正态分布、t分布、卡方分布和F 分布,并且能熟练查上述四个表。中心极限定理(Central Limit theorem):设从均值为,方差为 2(有限) 的任意一个总体中抽取大小为的样本,当充分大时(n30),样本均值 X 的抽样分布近似服从均值为,方差为 2/的正态分布。样本方差的分布设X 1,X 2,,X n为来自正态分布N(, 2)的样本,则从数学上可以推导出正态总体下样本方差S 2的分布为: ,1)(,)222nxSnii2-2 参数估计 点估计、区间估计与标准误 总体平均值的估计 标准差与方差的估计1、点估计、区间估计与标准误 点估计、区间估计的定义,二者的优缺点及联系 一个好的点估

17、计应满足的条件:一致性、无偏性、有效性和充分性 置信度、置信区间、显著性水平 标准误:广义-统计量的标准差;狭义-样本均值分布的标准差 2、总体平均值的估计 方差已知 总体正态或 总体非正态,大样本n30nZXn22),(或 方差未知 总体正态 nStXt22, 总体非正态,大样本n30 nSZX22,3、标准差与方差的估计 要求X服从正态分布 ,1122nSn总体方差的估计 ,212总体标准差的估计 ,212nSn2-3 假设检验 假设检验的原理 样本与总体平均数差异的检验 两样本平均数差异的检验 方差齐性检验 相关系数的显著性检验1、假设检验的原理 区间估计与假设检验的关系 假设检验中的小

18、概率原理 零假设与备择假设 两类错误 单侧检验和双侧检验,区分它们并注意二者临界值的不同 假设检验的一般步骤假设检验的步骤:1. 建立原假设和备择假设;2. 确定适当的检验统计量;3. 指定检验中的显著性水平;4.利用显著性水平根据检验统计量的值建立拒绝原假设的规则;5.搜集样本数据, 计算检验统计量的值;6.作出统计决策将检验统计量的值与拒绝规则所指定的临界值相比较,确定是否拒绝原假设。 2、样本与总体平均数差异的检验 零假设和备择假设:H 0: 0, H1: 0 方差已知,总体正态或非正态大样本, nXZ0 方差未知 总体正态 1,0ndfSXt 总体非正态 nSZ03、两样本平均数差异的

19、检验 零假设与备择假设H 0: 1 2, H1: 12 方差已知 独立样本 总体正态或非正态大样本 ,21nXZ 相关样本 总体正态或非正态大样本 nrXZ2121 方差未知 总体正态 独立样本 方差相等 2,121121 ndfnnSXt 方差不等 相关样本 总体非正态,大样本 独立样本21nSXZ iiidd XdnfSXt 2121, 相关样本 iiidd XnSXZ2121,4、方差齐性检验 一个未知总体方差与一个已知总体方差的检验 差 异 不 显 著与时当 差 异 显 著与时或当 202211202 ,)(Sndfn两个未知总体方差的检验 差 异如 果即 可 只 要 查一 般所 以由

20、 于 两 方 差 差 异 显 著时或当 两 方 差 差 异 不 显 著时当 小大22 212121212, ,.;,FFSFnS5、相关系数的显著性检验 H0:0 2,12ndfr H0: 0 310nZr H0:1 2 312121nZr2-4 方差分析 方差分析的原理与基本过程 完全随机设计的方差分析 随机区组设计的方差分析 两因素方差分析 事后检验1、方差分析的原理与基本过程 因素、因素水平、因变量、平方和、自由度、均方 零假设、备择假设 变异的分解 方差分析的步骤 方差分析应满足的条件方差分析应满足的条件(1) 总体正态分布总体、每个子总体服从正态分布;(2) 变异的可加性总变异可以分

21、解成几个不同来源的部分,这几个部分变异的来源在意义上必须明确,而且彼此要相互独立。(3) 各处理内的方差一致( 方差齐性)总体、各子总体的方差相等。各实验处理内的方差彼此应无显著差异。这是方差分析中最重要的假定。若不能满足,原则上不能进行方差分析。方差分析的步骤1、建立假设2、求平方和3、确定自由度4、求均方5、进行F检验6、列出方差分析表2、单因素完全随机设计的方差分析 SSt=SSb+SSWbtwbtSnkX,2223、随机化区组设计的方差分析的步骤:(1)建立假设H10:所有个出来的总体平均数是相同的,即不存在处理效应。H20:个区组的总体平均数是相同的,即不存在区组效应。(2)求平方和

22、 rbteaikjrkjaibt SSNXSNX,2122122(3) 自由度(4) 均方 11akSMkSeerrb(5) 进行 F 检验 显 著 差 异 。 个 区 组 的 平 均 数 无认 为则 接 受若 在 显 著 差 异有 两 个 区 组 的 平 均 数 存 少认 为 存 在 区 组 效 应 , 至则 拒 绝若 检 验 的 临 界 值查 表 确 定显 著 差 异 。 无认 为 个 处 理 的 平 均 数则 接 受若 数 存 在 显 著 差 异至 少 有 两 个 处 理 的 平 均 中认 为 个 处 理 的 平 均 数则 拒 绝若 检 验 的 临 界 值查 表 确 定 aHdfF ak

23、FdfMSFHdf akFdfSerrerr ererrebbeebeb,),(;, )1,()( ,),( ;, )1,()( ,00 (6) 列出方差分析表随机区组设计(单因素)的方差分析表变异来源 平方和 自由度 均方 F 临界值 F处理(组间) SSb k-1 MSb= SSb /(k-1) Fb= MSb / MSe区组 SSr a-1 MSr= SSr /(a-1) Fr= MSr / MSe误差 SSe (k-1)(a-1) MSe= SSe /(k-1)(a-1)总变异 SSt N-14、两因素方差分析几个基本概念(1)因素和水平(2)主效应与交互作用(3)总平方和的分解(4)

24、简单效应在两因素的完全随机设计中2-5 回归分析 一元线性回归分析 一元线性模型 模型的基本假设:线性、正态性、独立性、误差等分散性 估计回归方程的截距b 0和斜率b1 一元线性回归方程的检验 F检验 决定系数 一元线性回归方程的应用 预测:均值的预测、单个值的预测 控制2-6 卡方检验 1、拟合度检验(一个类别变量)02122010 ,1543k:HkefHfkii i则 拒 绝、 拒 绝 法 则 : 如 果 )( :、 计 算 检 验 统 计 量 的 值 别 的 期 望 频 数以 类 别 概 率 得 到 每 个 类为 真 时 , 用 样 本 容 量 乘、 假 定 每 个 种 类 的 观 察

25、 频 数、 选 择 随 机 样 本 , 记 录 多 项 概 率 分 布类 中 都 有 指 定 的 概 率 的: 总 体 不 服 从 其 中 所 有 多 项 概 率 分 布 ;类 中 都 有 指 定 的 概 率 的: 总 体 服 从 其 中 所 有 设、 建 立 零 假 设 和 备 则 假 的 步 骤多 项 总 体 的 拟 合 度 检 验 2、独立性检验(两类别变量) 零假设:两变量独立,备择假设:相关 计算期望次数nCTRjie jiij 样 本 容 量 列 之 和第行 之 和第 计算卡方值 1-CTRfn (3)e 2e-f (1)ji2ij2ij22 自由度 df=(R-1)(C-1)2-7 非参数检验 非参数方法的优缺点 独立样本均值差异的非参数检验 秩和检验法 中数检验法 相关样本均值差异的非参数检验 符号检验法 符号等级检验法

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 专业基础教材

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报