统计学是一组概念.docx-道客多多

资源描述

1、统计学是一组概念、原则和方法。用于 a 收集数据； b 分析数据；c 由数据得出结论科学是以方法为特征的，而不是它的研究对象心理学之所以成为科学就是因为以了科学的方法研究问题统计学是心理学研究结果表达的有效语言作为仪式的统计学心理学三种类型的研究问题与统计类型一：特征描述类型二：差异比较类型三：关系分析总体：是由具有某些共同特质(characteristic)的元素(element)或个体所组成的群体，是研究人员所要研究观察的对象的全体集合。样本：是由总体中抽取部份元素而组成的集合，是总体的一部份。参数：描述总体情况的一些统计指标，通常基于对样本的观察或测量的推断而获得。参数是我们

2、想要获取的，是统计的核心。例如通过普查得到中国大学生平均身高即为参数；统计量：对样本直接观察或测量所得的数值，通常用来推论参数。例如用随机方法抽出部分大学生测得的平均身高即为统计量。总体样抽样总体参数推断inference样本统计量的总体参数符号名称样本总体定义从总体中抽出的部分单位数研究对象的全部单位总数特征统计量参数符号样本容量： n 样本平均数：样本比例：样本标准差：s样本方差总体容量： N总体平均数：总体比例： p总体标准差：总体方差：描述统计与推断统计描述统计(descriptive statistics)是来描绘或总结的观察量的基本情况的统计总称。描述统

3、计学研究如何取得反映客观现象的数据，并通过图表形式对所收集的数据进行加工处理和显示。推断统计（inferential statistics）是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。变量总体确定之后，研究者应对每个观察单位的某项特征进行测量或观察，该特征称为变量。如“身高”、“体重 ”、 “性别” 、 “智商”等。变量的测定值或观察值称为变量值或观察值，亦称为数据（data ）。描述统计与推断统计的关系美国统计学家史蒂文斯 ( S.S. stevens) 1968 年按照变量的性质和数学运算的

4、功能特点,将变量的统计测量尺度划分为定类尺度、定序尺度、定距尺度和定比尺度四类测量尺度测量的尺度决定了我们可以从测量数据中得到的回答的类型。数据的信息水平。称名测量（nominal scales）在于表明一件事物不同于另一件事物；没有数量的特征； E.g. 性别（ 1、2），城乡（1、2 顺序测量（ordinal scales）在于表明一个序列中的位置；不能说明两者之间差别多少； E.g.比赛排名等，常见的量表等距和等比测量（interval 作为知识层次中的中间层，信息数据处理知识：是信息、文化脉络以及经验的组合。智慧（Wisdom ） -知识的选择，应对的行动方案可

5、能有多种，但选择哪个靠智慧。数据的整理在获得原始数据资料之后，需要使用一定的方法对数据进行整理和综合，目的是从大量的原始数据资料中提炼所需要的信息，使之可以提供概要信息并能反映对象总体的基本数量特征，便于人们的理解和使用。表格和图形是整理和反映统计资料的主要工具。频数分布频数分布(Frequency distribution)：对一数据集的表格汇总法，显示若干无重叠组别中每一组的项目频数（或个数）。相对频数分布(Relative frequency distribution)：一数据集的表格汇总法，显示在若干无重叠组别中每一组的项目总数的相对频数，即分数或比例。直方图(Histog

6、ram)：一种通过在横轴上放置组间隔，在纵轴上放置频数来描述数量数据的频数分布、相对频数分布或百分数频数分布。直方图与条形图条形图是用宽度相同的条形的高度或长度来表示数据变动的图形。直方图是用矩形的宽度和高度来表示频数分布的图形。直方图中的直方条显示出不能分开、连续的；条形图中的直方条显示是可以分开的。百分数频数分布(Percent frequency distribution)：一数据集的表格汇总法，显示几个无重叠组别中每一组的项目总数的百分率。条形图(Bar graph)：一种图形方法，描述在品质数据的频数分布、相对频数据分布或百分数频数分布中表示的信息。饼形图(Pie cha

7、rt)：一种描述品质数据汇总的图形方法，建立于把一个圆细分成与每一组的相对频数相对应的扇型的基础上。累积频数分布(Cumulative frequency distribution)：对数量数据集的表格法汇总，显示数值小于或等于每一组组上限的项目数。累积相对频数分布：对数量数据的表格法汇总，显示数值小于或等于每一组组上限的项目分数或比例。累积百分数频数分布：对数量数据的表格法汇总，显示数值小于或等于每一组组上限的项目的百分率。探索性数据分析技术由简单算术和易画的图形组成，可以用于快速地汇总数据。茎叶显示(Stem-and-leaf display)：一种同时排列数量数据顺序并提供分布

8、形态的深入信息的探索性数据分析技术。茎叶图由两部分组成：茎（stem）与叶（leaf）茎：通常由每组数的高位数值（leading digits）形成，按组竖立在左边；叶：通常由每组数的低位数值（last digits）形成，按组横排在“茎”的右边。坐标轴：坐标轴最大最小的取值十分有艺术性，想要让数值看起来夸张点，就把最大最小值之间的范围缩小点，反之亦可。趋势线：趋势线是画龙点睛，简直就是专门为了误导别人而设计的。 1. 直线型趋势线，只取头尾两值的连线，中间的忽略不计 2. 移动平均线：移动平均线的周期的取值会导致图形巨大差异颜色：作为障眼法， 1.假如有多条线，有一条比较难看，那么

9、就把这条的颜色跟背景设置成类似，这样看起来就不是很明显了。 2.假如有条线下面很难看，那么可以把背景颜色改成双色，下面的背景颜色跟线接近甚至一样，在多条线的时候效果更好， APA 统计表规范 1.整个统计表应以“置中”的方式放在内文的中间。 2.而标题在表的正中央上方(标题和表之间不空行 )，标号（如“表 1”）和标题的文字之间空一个全型格。 3.表格的安排，能使读者易于掌握重要的资料 4.通常文字解释先于图表 5.APA 格式因供期刊论文之用，通常在表格内不画纵向直线，但为求美观，一般学位论文也可画纵向直线。平均数(Mean)：衡量数据集中心位置的量度。用所有

10、数据值相加的和除以项数计算。如果数据来自某个样本，则平均数以表示；如果数据来自某个总体，则其平均数以希腊字母表示。样本平均数总体平均数Review：总体参数：用来概括总体数据的量度的数值。样本统计量：用来概括样本数据的量度的数值。众数是一组数据分布的峰值，它是一种位置代表值，不受极端值的影响。缺点是不具有唯一性；中位数是一组数据中间位置上的代表值，特点是不受数据极端值的影响；均值是对于数值型数据计

11、算的，而且利用了全部数据信息，它具有良好的数学性质，应用比较广泛。缺点是易受极端数据的影响。对于偏态分布数据，均值代表性较差。当数据为偏态分布，特别是偏度较大时，应选择众数或中位数等位置代表值。方差与标准差是表示一组数据离散程度的最好指标。其值越大说明离散程度大，其值小说明数据比较集中。反应灵敏。容易计算；简单明了；适合代数运算；受抽样变动的影响小，不同样本的标准差或方差比较稳定；具有可加性。可以把总变异分解为不同来源的变异。每个观测值加上相同常数 C 后，计算得到的标准差不变；每个观测值都乘以一个相同常数 C 后，计算得到的标准差是原来标准差的 C 倍标准差系数(Coeffi

12、cient of variation)：衡量数据集相对变异程度的量度，以标准差除以平均数再乘以 100 得到。 Z 分数 (z-Score)：以距平均数的离差( )除以标准差 s 所得的值。Z 分数是标准化的数值，指数据值 xi 距离平均数的标准差的个数。 z 分数经常被称为是标准化分数。比如，z 1=1.2 表示 x1 比样本平均数大 1.2 个标准差。z 2=-0.5 表示 x2 比样本平均数小 0.5 个标准差。两个不同数据集的项有相同的 z 分数，则可以说它们有相同的相对位置，因为它们都与平均数的距离有相同个数的标准差。切贝谢夫定理(Chebyshers theorem) 在任意

13、一个数据集中，至少有（1-1/z 2）的数据项与平均数的距离都在 z 个标准差之内，其中 z是任意大于 1 的值。 z = 2，3，4 个标准差时，这一定理的含义：至少 0.75，即 75的数据项与平均数的距离在z=2 个标准差之内。至少 0.89，即 89的数据项与平均数的距离在z=3 个标准差之内。至少 0.94，即 94的数据项与平均数的距离在z=4 个标准差之内。假设 100 名学生统计学课程考试，平均分数为70，标准差为 5，那么有多少学生的分数在6080 之间？有多少学生的分数在 58-82 之间？对于 60-80 之间，到 60 比平均数低两个标准差而80 比平均数高两

14、个标准差。利用切贝谢夫定理，至少有 0.75 即 75的数据项与平均数的距离在两个标准差之内。对于 58-82 之间，我们由(58-70)/5=-2.4 知，58比平均分低 2.4 个标准差，又由(82-70)/5=2.4 知，82 比平均分高 2.4 个标准差。应用切贝谢夫定理，z =2.4 得到：即至少有 8 2 . 6的学生的分数在 5 88 2 之间。经验法则(Empirical rule) 对于钟形或山峰形分布(正态分布 )的数据：约 68的数据项与平均数的距离在 1 个标准差之内。约 95的数据项与平均数的距离在 2 个标准差之内。几乎所有的数据项与平均数的距离在 3 个

15、标准差之内异常值(Outlier)检测可能是一个数据项被错误地记录了可能是一个数据项被错误地包含在这个数据集中可能就是一个反常的值，它被正确地记录并且的确属于这个数据集利用 z 分数来检测异常值时，任何 z 分数小于-3或大于+3 的值都可作为异常值。在实践中，为了精确定义概率，人们使用了不同的方法，但并没有达成一致。经常地，会用到下列3 种方法之一： (1) 古典法。(2) 相对频数法。(3) 主观法。古典法(Classical method)：在随机试验中有这样一类随机试验，试验的结果只有有限多个，且这些试验结果出现的可能性都是等可能的，称这样的试验为古典型随机试验。对于古

16、典型随机试验，如果试验的全部结果有 n个，其中有且仅有 mmn 个结果导致随机事件 A 发生，则称比值 m/n 为随机事件 A 的概率。记作 P（ A）=m/n 相对频数法(Relative frequency method)：一种以试验或历史数据为基础的概率分配方法。是一种定义概率的经验方法。例：假设在某产品市场评估试验中，共联系了 400名潜在顾客，结果有 100 人购买了该产品，300人未购买。事实上，我们相当于把联系某一顾客的试验重复了 400 次，而结果中有 100 次是产品被购买。因此，我们可以利用相对频数作为某一名顾客购买该产品概率的估计。对于顾客购买该产品的结果，我们分配以

17、 100 / 400 = 0.25 的概率。主观法(Subjective method)：一种以主观判断为基础的概率分配方法。常常用在不太可能重复试验的情况下。例如，考虑皇马队将进行的下一场足球赛，该队获胜的概率是多少？试验的结果即获胜、失利和平局并不一定是等可能发生的。此外，由于参赛队伍在近几年中并未有几次交手，所以对于将要举行的比赛也没有相对频数的数据可用。因此，为了估计球队获胜的概率，我们必须对其进行主观评价简单事件：可以用一个特征描述。 E.g. 如果某人对“购买计划”感兴趣，则事件是“计划购买”和“不计划购买”。所有可能事件的集合叫做样本空间联合事件：具有两个特征的事件 E

18、.g. “计划购买并实际购买”则是联合事件。以列联表的方式观察样本空间列联表：为了研究两个分类变量对数据进行分类，使用一个表示两个变量的交叉分组表格简单概率：某一简单事件发生的概率，记作P（A）；在列联表中，也称为边际概率。 E.g. 任选一户家庭，已购 DVD 的概率 P（已购DVD）=108/300 联合概率：涉及两个或多个事件的情形。 E.g.任选一户家庭，已购 HDTV 和已购 DVD 的概率 P（已购 HDTV 和已购 DVD）=38/300 已购 DVD 已购HDTV 是否合计 HDTV 38 42 80 非HDTV 70 150 220 合计 108 192 300 事

19、件 A 的补(Complement of event A)：由所有不包含在 A 的样本点构成的事件。 P(A)+P(Ac)=1 例：假设某采购部声称供货商运来的货物中无残次品的概率为 90，利用补，我们可以推断出货物中有残次品的概率为 1-0.90 = 0.10 事件 A 和事件 B 的并(Union of A and B)：所有的属于 A 或 B 或同时属于二者的事件。A 和 B 的并记作 AB。事件 A 和事件 B 的交(Intersection of A and B)：同时属于 A 和 B 的事件。A 和 B 的交记作 A B。 A 或 B 的概率等于 A 的概率和 B 的概率之和减去

20、A 和 B 的概率，即 P(AB)= P(A)+P(B)-P(A B) 如果 P(A B)=0，两个事件为互斥事件。对于互斥事件加法公式简化为 P(AB)= P(A)+P(B) 经验法则：当 n /N0.05 时，一般可忽略有限总体修正系数。样本均值的标准差反映了样本均值与总体均值的平均误差，故称之为抽样平均误差（或抽样标准误），如公式所示，抽样平均误差与总体标准差成正比变化，与样本容量的平方根成反比变化。拒绝（否定）域根据虚无假设 H0 确定的抽样分布内一端或二端的小区域，如果样本统计量的值在此区域范围内，则拒绝虚无假设 H0。显著度（显著性水平）拒绝域在整个抽样分布中所占的比例；

21、表示样本统计量的值落在拒绝域内的机会；虚无假设为真时，拒绝它的概率。表示为 (alpha)常用的值有 0.01, 0.05, 0.10 由研究者事先确定单侧和双侧检验如果拒绝域只在一侧，称为单侧检验；如果拒绝域在两侧的位置，则称为双侧检验。选择单侧检验与双侧检验主要根据研究假设而定。在所选显著度相同的情况下，双侧检验比单侧检验更难拒绝虚无假设。单侧假设如何设定？虚无假设与备择假设的选择是有现实背景的，研究者研究问题的着眼点不同将导致不同的虚无假设；虚无假设始终是受到质疑的，同时也是受到保护的，而备择假设才是研究者真正想得到结论。假设检验中的决策是针对虚无假设的，而结论是针

22、对备择假设的。由于虚无假设是受到保护的，所以，肯定它并不具有说服力，充其量也只能说明样本没有出现与虚无假设相矛盾的地方，而拒绝虚无假设是有充分说服力的。当决策是不能拒绝原假设时，假设检验方法失效。 a 错误和 b 错误的关系 1 对于固定的样本容量 n，与不能同时减小统计检验力（power of a test）能够正确拒绝一个错误的虚无假设的概率， 1- 称为假设检验的功效。其意义是，当所研究的总体与 H0 确有差别时，按检验水平能够发现它（拒绝 H0）的概率。如果 1- =0.90，则意味着当 H0 不成立时，理论上在每 100 次抽样中，在的检验水准上平均有 90 次能拒绝 H

23、0。一般情况下对同一检验水准，功效大的检验方法更可取。比例检验的 z 统计量公式中 P0 为假设的总体比率案例某研究者估计本校学生的电脑拥有率为 30%。现随机抽查了 200 的学生，其中 68 个学生拥有电脑。试问研究者的估计是否可信？ ( = 0.05) 提出 H0H1；H 0： .30 ；H 1： .30 ；确定统计检验的方法；z 分数显著性水平； .05 抽样分布；标准正态分布决定 H0 拒绝区间；如果|z observed| |1. 96|，拒绝H0 总结和分析数据： p-值(p-value) ：当虚无假设为真时，所获得的本结果至少与实测结果不同的概率值，它通常又被称为实测显著性水平。或者，换一种说法，即是：当 H0 为真时，得到当前以及更极端的样本统计量的概率。例：“电脑拥有率”例中与样本比率34%(68/200）相联系的 p-值。给定总体比率的假设值.30 时，p 值为观测到的样本比率的值小于等于实测值= .34 的概率。（z= +1.96 时，样本p 分别为 0.36 和 0.24）p0.30 0.340.24.025拒拒.0250P-value

展开阅读全文