收藏 分享(赏)

第三讲:样本推断.ppt

上传人:dcjskn 文档编号:9504958 上传时间:2019-08-11 格式:PPT 页数:97 大小:865KB
下载 相关 举报
第三讲:样本推断.ppt_第1页
第1页 / 共97页
第三讲:样本推断.ppt_第2页
第2页 / 共97页
第三讲:样本推断.ppt_第3页
第3页 / 共97页
第三讲:样本推断.ppt_第4页
第4页 / 共97页
第三讲:样本推断.ppt_第5页
第5页 / 共97页
点击查看更多>>
资源描述

1、第三讲,样本推断,本讲主题Session Topic,抽样及抽样分布 Sampling and Sampling Distribution 区间估计 Interval Estimation 假设检验Hypothesis Testing,抽样及抽样分布 Sampling and Sampling Distribution,简单随机抽样 Simple Random Sampling 点估计 Point Estimation 抽样分布 Sampling Distribution的抽样分布 Sampling Distribution of 的抽样分布 Sampling Distribution of

2、点估计的特征 Properties of Point Estimation 其他的抽样方法 Other Sampling Methods,应用:电子联合公司的抽样问题,电子联合公司的人力资源部要拟定一份公司2500名经理的简介,需要介绍经理们的平均年薪和已完成培训计划的经理的比例,我们所关心的问题是如何从经理样本中而不是从所有2500名经理总体中得到我们所需要的信息,统计推断 Statistical Inference,统计推断的目的是要从样本所包含的信息推断总体的信息 总体(population)是研究中所有感兴趣个体(element)的集合 样本(sample)是总体的一个子集 样本结果只

3、是提供了总体特征价值的一个估计 参数(parameter)是总体的一个数量特征 应用合理的抽样方法结果能提供总体特征的一个很好的估计,简单随机抽样 Simple Random Sampling,有限总体(Finite Population) 从容量为N的有限总体进行抽样,如果容量为n的每个可能样本被抽到的可能性相等,称这容量为的样本为简单随机样本。 在抽下一个元素之前将抽到的元素放回去,这种抽样形式的抽样 称为放回抽样(Sampling with Replacement)。 在抽下一个元素之前将抽到的元素不放回去,这种抽样形式的抽样 称为不放回抽样(Sampling without Repla

4、cement). 计算机产生的随机数是常的自动取样过程,简单随机抽样 Simple Random Sampling,无限总体(Infnite Population) 无限总体的简单随机样本满足条件 每个个体都来自同一个总体; 每个个体的抽取是相互独立的。 如果所研究的总体是一个正在进行的过程,统计总体的每个个体不可能,则通常认为总体的无限的。 对于无限总体不能进行标号,抽样过程不能用随机数。,点估计Point Estimation,为了估计总体的某个参数值,计算对应样本的特征来进行估计例如 用样本均值 来估计总体均值 用样本方差 来估计总体方差 用样本比例 来估计总体比例,实际举例:经理平均年

5、薪及参加培训比例,从2500名经理中抽取一个容量为30的样本 这30名经理年薪的平均值即是2500名经理平均年薪的一个估计值; 这30名经理参加某项管理培训的比例即是2500名经理参加某项管量培训比例的一个估计值;(见例3.1),抽样分布 Sampling Distribution,样本统计量(Sample Statistic):样本的不含未知参数的函数,比如样本均值、样本方差等; 在上例中,从2500名经理中随机抽取30名经理,得到一个平均年薪 51808,一个参加培训的比例 0.63但如果再重新抽取30名经理,又会得到一个平均年薪及参加培训的比例;假如将抽样过程重复500次,就得到500个

6、样本均值及比例值。因此,在样本容量保持不变的情况下,样本均值及比例都是随机变量。既然是随机变量,就会有相应的分布。 任何一个特定样本统计量的概率分布称为统计量的抽样分布。,的抽样分布 Sampling Distribution of,总体均值,从总体中抽取一个容量为n的样本,汇总样本数据,计算出样本均值,用样本均值 来推断总体均值,用样本均值推断总体均值的统计过程,的期望值及标准差,的期望值的标准差,有限总体,无限总体 或的有限总体,有限总体校正因子,中心极限定理Central Limit Theorem,当总体是正态总体时,对任何的样本容量, 的抽样分布都是正态分布 当总体不是正态分布时,只

7、要样本容量很大, 的抽样分布可以近似看成正态分布近似地服从标准正态分布,的抽样分布 Sampling Distribution of,总体比例,从总体中抽取一个容量为n的样本,汇总样本数据,计算出样本比例,用样本比例 来推断总体比例,用样本比例推断总体比例的统计过程,的期望值及标准差,的期望值的标准差,有限总体,无限总体 或的有限总体,有限总体校正因子,的抽样分布类型,当样本容量很大时(np5,n(1-p) 5), 的抽样分布近似地服从正态分布 近似地服从标准正态分布,点估计的特征 Properties of Point Estimation,无偏性(Unbiasedness) 如果样本统计量

8、的期望值等于所估计的总体参数值,则称其为该参数的无偏估计量 有效性(Efficiency) 有最小标准差的无偏估计量 一致性(Consistency) 随着样本容量的无限增加,估计量的值无限接近被估参数值的概率为1,其他的抽样方法 Other Sampling Methods,分层抽样(Stratified Random Sampling) 整群抽样(Cluster Sampling) 系统抽样(Systematic Sampling) 方便抽样(Convenience Sampling) 判断抽样(Judgment Sampling),分层抽样 (Stratified Random Samp

9、ling),将总体中的个体分成若干个称为层的组,使得每一个个体属且只属于其中一个层,层内个体具有最大的同质性,即对所研究指标具有最小差异性。 分层抽样的意义在于可用较小的样本容量获得与简单随机抽样相同精度的结果。 分层抽样的价值依赖于层内个体同质性的程度。,整群抽样 Cluster Sampling,将总体中的个体分成若干个称为群的组,使得每一个个体属且只属于其中一个群,群内个体具有最大的异质性,即对所研究指标具有最大差异性。即每个群都是总体的一个缩影。最后选取若干群构成简单随机样本。 整群抽样的样本容量并不小,但由于个体较集中而可达到节约成本的目的。 整群抽样的价值依赖于每个群代表总体的程度

10、。,系统抽样Systematic Sampling,在总体容量较大的情况下,抽取简单随机样本限费时间,有时甚至是无法实现。代替简单随机抽样的一种方法就是系统抽样。 例如 要从5000个个体的总体中抽取50个个体作为一个样本,可在总体的每100个个体中抽取一个个体。 先从总体的第1个100个个体中随机抽取一个个体,然后按照每隔100个个体抽取一个作为样本个体,从而构成所需样本。 由于第一个个体的抽取是随机的,一般假定系统抽样也具有简单随机抽样的特征。,方便抽样 Convenience Sampling,方便抽样是一种非概率抽样技术,某个个体被选入样本事先并没有确定或被抽中的概率不知道。 优点是样

11、本的抽取和数据的收集相对较容易,但效果可能好,也可能不好。 有时候,研究人员设计出一些适应于方便抽样的统计方法,以致于可以将方便抽样本看成随机样本。 在应用从方便样本所得到的结果对总体进行推断时要格外小心。,判断抽样 Judgment Sampling,判断抽样是另一种非概率抽样技术。 先由对所研究问题有权威的人员从总体中抽取被认为最能代表总体的个体进入样本。 样本结果的质量要依赖于抽取样本人员的判断。 在用判断样本所得出的结论对总体进行推断时仍然要小心谨慎。,区间估计 Interval estimation,正态总体均值的区间估计 Interval estimation of the nor

12、mal population mean 非正态总体均值的区间估计 Interval estimation of the abnormal population mean 比例的区间估计 Interval estimation for the Proportion 样本大小估计 Sample size estimation,区间估计Interval Estimation,总体参数 的区间估计就是对某一给定的概率 ,确定某个区间 ,使 包含 的概率为 。此时,称 为置信度,称 为置信度为 的置信区间。注:总体参数的点估计就是用样本的相应估计量的值作为该参数的近似值,正态总体均值的区间估计 Inte

13、rval Estimation of a Normal Population Mean,1、总体标准差已知:设 ,则有其中 为样本均值标准化后有,正态总体均值的区间估计 Interval Estimation of a Normal Population Mean,对任意给定的 ,可以找到 使( 是标准正态分布右侧 面积的 值,比如,当 时, ),正态总体均值的区间估计 Interval Estimation of a Normal Population Mean,整理得或,正态总体均值的区间估计 Interval Estimation of a Normal Population Mean,

14、于是,就找到了一个确定的区间 使它包含总体均值 的概率为 。或总体均值 的一个置信度为 的置信区间为,正态总体均值的区间估计 Interval Estimation of a Normal Population Mean,2、总体标准差未知这时用样本标准差 代替总体标准差 ,但有其中 为样本均值,自由度指进入 独立信息的条数,由于 的限制,独立信息的条数为n-1,正态总体均值的区间估计 Interval Estimation of a Normal Population Mean,对任意给定的 ,可以找到 使( 是自由度为n-1的t-分布右侧 面积的 值,比如,当 时, ),正态总体均值的区间

15、估计 Interval Estimation of a Normal Population Mean,整理得或,正态总体均值的区间估计 Interval Estimation of a Normal Population Mean,于是,就找到了一个确定的区间 使它包含总体均值 的概率为 。或总体均值 的一个置信度为 的置信区间为,非正态总体均值的区间估计 Interval Estimation of the Abnormal Population Mean,对于非正态总体,由中心极限定理,当样本容量较大时( ),也有其中 为样本均值, 为总体均值, 为总体标准差,非正态总体均值的区间估计 I

16、nterval Estimation of the Abnormal Population Mean,1、若总体标准差已知,即:也有这时,总体均值 的置信度为 的置度区间为或,非正态总体均值的区间估计 Interval Estimation of the Abnormal Population Mean,2、若总体标准差未知,则有这时,总体均值 的置信度为 的置度区间为或,比例的区间估计 Interval Estimation for the Proportion,由于在大样本条件下,比例的区间估计 Interval Estimation for the Proportion,于是,就找到了一

17、个确定的区间 使它包含总体均值 的概率为 。或总体均值 的一个置信度为 的置信区间为,样本大小估计 Sample Size Estimation,对于前述区间估计而言,有三种误差边际1、2、3、,样本大小估计 Sample Size Estimation,现在的问题是:样本容量为多少时,方使得误差边际符合所设定的要求E。对于前后两种情况,由于 与n无关,则可由等式 及 解出及,样本大小估计 Sample Size Estimation,而对于第二种情况,由于 及 都依赖于n,所以n 不确定,也无法定。通常的做法是,用 近似代替 ,而 则根据以往的经验来定,因而有,假设检验 Hypothesis

18、 Testing,假设检验思想 Hypothesis Testing Methodology 正态总体均值的假设检验 Hypothesis Testing of the Normal Population Mean 非正态总体均值的假设检验 Hypothesis Testing of the Abnormal Population Mean 比例的Z检验 Test of Hypothesis for the Proportion 区间估计与假设检验 Interval Estimation and Hypothesis Testing,假设检验思想 Hypothesis Testing Meth

19、odology,例1环保局想确定某工厂释放到大气中的某类污染物的平均水平 是否符合国家规定的的标准。如果 是国家对这种污染物排放规定的上限,那么如何根据该厂若干次的测量值(样本)来确定该厂是否违反了法律,即确定是否 例2 一电器厂要向供应商购买一批电子元件,供应商承诺保应该批元件的不合格率低于1%。为慎重起见,电器厂随机抽查了200个元件进行检验,结果有3个不合格,问电器厂是否有理由拒收这批元件。,假设检验思想 Hypothesis Testing Methodology,什么是假设 对总体参数的数值所作的陈述,统称统计假设 总体参数可能是总体的均值 总体参数可能是总体的比例 总体参数可能是总

20、体的标准差,假设检验思想 Hypothesis Testing Methodology,零假设 与备选假设 通常将研究者想收集证据予以反对的假设称为零假设。 比如:中国人的平均身高依旧是1.68米。: 通常将研究者想收集证据予以支持的假设称为替代假设(或研究假设、备选假设):,假设检验思想 Hypothesis Testing Methodology,选择 及 例1例2(见前) 例3 质量控制人员定期对一台加工金属的车床进行检查,以确定这台车床所生产的机器轴承的平均直径是否为0.5英寸。如果轴承的平均直径大于或小于0.5英寸,则表明生产过程失控,必须加以调整通。,假设检验思想 Hypothes

21、is Testing Methodology,单尾假设检验及双尾假设检验 备选假设具有方向性,并含有符号“”或“”的假设检验,称为单尾假设检验。 备选假设并未指定偏离 的特殊方向,并含有符号“ ”的假设检验,称为双尾假设检验。,假设检验思想 Hypothesis Testing Methodology,假设检验中的决策及其后果假设检验的目的是作出某种决策,特别对要对是否拒绝零假设 并倾向备选假设 作出决策。由于决策是建立在样本信息基础上的,常会犯两类错误: 第一类错误:当零假设为真时却被拒绝接受。犯第一类错误的概率常记作 第二类错误:当零假设为假时却被接受。犯第二类错误的概率常记作,与 的关系

22、:当 增大时 减小,当 增大时 减小,使 和 同时减小的唯一办法是增加样本容量。,假设检验思想 Hypothesis Testing Methodology,陈述假设及作结论的步骤 将想予以支持的假设作为备选假设 来陈述; 零假设 将是备选假设 的对立假设; 如果样本证据支持备选假设,则拒绝零假设。作出这种决策犯错误的概率是 ,而 值的大小可人为控制; 如果样本证据并未提供充分证据支持备选假设,那就作出根据样本不能拒绝零假设的结论。在此情形下,研究者也许期望获得一个较大的样本,以获得有关所研究问题的较多信息。,假设检验思想 Hypothesis Testing Methodology,小概率事

23、件原理:概率很小的事件在一次试验(观测)中不可能发生。 例:假设某台包装机所包装的食品袋重量服从标准差为20克的正态分布,今随机抽取30包称重,得平均值重量为480克,问该包装机工作是否正常(正常时,平均重量应为500克):,正态总体均值的假设检验 Hypothesis Testing of the Normal Population Mean,1、总体标准差已知: ,要检验: :在 条件满足之下,有其中 为样本均值, 为样本容量。,正态总体均值的假设检验 Hypothesis Testing of the Normal Population Mean,对任意给定的 ,可以找到 使(5.1)(

24、 是标准正态分布右侧 面积的 值,比如,当 时, ),正态总体均值的假设检验 Hypothesis Testing of the Normal Population Mean,将样本均值 的观测值代入计算出 ,如果 ,则表明由(5.1)式所代表的小概率事件的确在一次试验中发生了,这与小概率事件原理相违被。由于导致该小概率事件发生的前提是待验假设 ,因而只能否定原假设 ,接受备选假设 。,正态总体均值的假设检验 Hypothesis Testing of the Normal Population Mean,2、总体标准差已知: ,要检验: :由于其中 为样本均值, 为样本容量。,正态总体均值的

25、假设检验 Hypothesis Testing of the Normal Population Mean,对任意给定的 ,可以找到 使(5.2)( 是标准正态分布左侧 面积的 值,比如,当 时, ),正态总体均值的假设检验 Hypothesis Testing of the Normal Population Mean,在 的假设( )之下,有进而有,正态总体均值的假设检验 Hypothesis Testing of the Normal Population Mean,及从而得,在 ( )之下,结合(5.2)有(5.3),正态总体均值的假设检验 Hypothesis Testing of

26、the Normal Population Mean,将样本均值 的观测值代入计算出 ,如果 ,则表明由(5.3)式所代表的小概率事件的确在一次试验中发生了,这与小概率事件原理相违被。由于导致该小概率事件发生的前提是待验假设 ,因而只能否定原假设 ,接受备选假设 。,正态总体均值的假设检验 Hypothesis Testing of the Normal Population Mean,3、总体标准差未知,要检验: :在 条件满足之下,有其中 为样本均值, 为样本标准差, 为样本容量。,正态总体均值的假设检验 Hypothesis Testing of the Normal Populatio

27、n Mean,对任意给定的 ,可以找到 使(5.4)( 是标准正态分布右侧 面积的 值,比如,当 时, ),正态总体均值的假设检验 Hypothesis Testing of the Normal Population Mean,将样本均值 的观测值代入计算出 ,如果 ,则表明由(5.4)式所代表的小概率事件的确在一次试验中发生了,这与小概率事件原理相违被。由于导致该小概率事件发生的前提是待验假设 ,因而只能否定原假设 ,接受备选假设 。,正态总体均值的假设检验 Hypothesis Testing of the Normal Population Mean,4、总体标准差未知,要检验: :由

28、于其中 为样本均值, 为样本容量。,正态总体均值的假设检验 Hypothesis Testing of the Normal Population Mean,对任意给定的 ,可以找到 使(5.5)( 是T分布左侧 面积的 值,比如,当 时, ),正态总体均值的假设检验 Hypothesis Testing of the Normal Population Mean,在 的假设 ( )之下,有进而有,正态总体均值的假设检验 Hypothesis Testing of the Normal Population Mean,及从而得,在 ( )之下,结合(5.5)有(5.6),正态总体均值的假设检验

29、 Hypothesis Testing of the Normal Population Mean,将样本均值 的观测值代入计算出 ,如果 ,则表明由(5.6)式所代表的小概率事件的确在一次试验中发生了,这与小概率事件原理相违被。由于导致该小概率事件发生的前提是待验假设 ,因而只能否定原假设 ,接受备选假设 。,非正态总体均值的假设检验 Hypothesis Testing of the Abnromal Population Mean,1、总体标准差已知: ,要检验: :在 及大样本条件之下,有其中 为样本均值, 为样本容量。,非正态总体均值的假设检验 Hypothesis Testing

30、of the Abnormal Population Mean,对任意给定的 ,可以找到 使(5.7)( 是标准正态分布右侧 面积的 值,比如,当 时, ),非正态总体均值的假设检验 Hypothesis Testing of the Abnormal Population Mean,将样本均值 的观测值代入计算出 ,如果 ,则表明由(5.7)式所代表的小概率事件的确在一次试验中发生了,这与小概率事件原理相违被。由于导致该小概率事件发生的前提是待验假设 ,因而只能否定原假设 ,接受备选假设 。,非正态总体均值的假设检验 Hypothesis Testing of the Abnormal Po

31、pulation Mean,2、总体标准差已知: ,要检验: :在大样本之下其中 为样本均值, 为样本容量。,非正态总体均值的假设检验 Hypothesis Testing of the Abnormal Population Mean,对任意给定的 ,可以找到 使(5.8)( 是标准正态分布左侧 面积的 值,比如,当 时, ),非正态总体均值的假设检验 Hypothesis Testing of the Abnormal Population Mean,在 的假设( )之下,有进而有,非正态总体均值的假设检验 Hypothesis Testing of the Abnormal Popula

32、tion Mean,及从而得,在 ( )之下,结合(5.8)有(5.9),非正态总体均值的假设检验 Hypothesis Testing of the Abnormal Population Mean,将样本均值 的观测值代入计算出 ,如果 ,则表明由(5.9)式所代表的小概率事件的确在一次试验中发生了,这与小概率事件原理相违被。由于导致该小概率事件发生的前提是待验假设 ,因而只能否定原假设 ,接受备选假设 。,非正态总体均值的假设检验 Hypothesis Testing of the Abnormal Population Mean,3、总体标准差未知,要检验: :在 及大样本条件满足之下

33、,有其中 为样本均值, 为样本标准差, 为样本容量。,非正态总体均值的假设检验 Hypothesis Testing of the Abnormal Population Mean,对任意给定的 ,可以找到 使(5.10)( 是标准正态分布右侧 面积的 值,比如,当 时, ),非正态总体均值的假设检验 Hypothesis Testing of the Abnormal Population Mean,将样本均值 的观测值代入计算出 ,如果 ,则表明由(4.10)式所代表的小概率事件的确在一次试验中发生了,这与小概率事件原理相违被。由于导致该小概率事件发生的前提是待验假设 ,因而只能否定原假设

34、 ,接受备选假设 。,非正态总体均值的假设检验 Hypothesis Testing of the Abnormal Population Mean,4、总体标准差未知,要检验: :由于其中 为样本均值, 为样本容量。,非正态总体均值的假设检验 Hypothesis Testing of the Abnormal Population Mean,对任意给定的 ,可以找到 使(5.11)( 是T分布左侧 面积的 值,比如,当 时, ),非正态总体均值的假设检验 Hypothesis Testing of the Abnormal Population Mean,在 的假设 ( )之下,有进而有,

35、非正态总体均值的假设检验 Hypothesis Testing of the Abnormal Population Mean,及从而得,在 ( )之下,结合(5.11)有(5.12),非正态总体均值的假设检验 Hypothesis Testing of the Abnormal Population Mean,将样本均值 的观测值代入计算出 ,如果 ,则表明由(4.12)式所代表的小概率事件的确在一次试验中发生了,这与小概率事件原理相违被。由于导致该小概率事件发生的前提是待验假设 ,因而只能否定原假设 ,接受备选假设 。,单个总体比例的假设检验 Hypothesis Testing of t

36、he Proportion,用 表示总体比例, 表示总体比例的某一特定假设值,则有关总体比例的假设有以下三种形式,单个总体比例的假设检验 Hypothesis Testing of the Proportion,1、由于在大样本情况下则在 下有,单个总体比例的假设检验 Hypothesis Testing of the Proportion,于是,对任意的 ,有 使,单个总体比例的假设检验 Hypothesis Testing of the Proportion,将 的样本观测值代入 得 的观测值 ,若 ,则拒绝原假设 ,否则,接受原假设 。,单个总体比例的假设检验 Hypothesis Te

37、sting of the Proportion,2、由于在大样本情况下,单个总体比例的假设检验 Hypothesis Testing of the Proportion,于是,对任意的 ,有 使,单个总体比例的假设检验 Hypothesis Testing of the Proportion,在假设 下,单个总体比例的假设检验 Hypothesis Testing of the Proportion,从而有,单个总体比例的假设检验 Hypothesis Testing of the Proportion,将 的样本观测值代入 得 的观测值 ,若 ,则拒绝原假设 ,否则,接受原假设 。,区间估计

38、与假设检验 Interval Estimation and Hypothesis Testing,对于双尾检验,否定原假设的条件为或 即对样本均值 的接受范围为或,区间估计与假设检验 Interval Estimation and Hypothesis Testing,而实际上或 正是总体均值 的置信度为 的置信区间,因此也可借助置信区间来对假设进行检验:当置信区间包含假定的 的值时,则不拒绝原假设 ;否则,拒绝原假设 。,本讲小结,介绍简单随机抽样和抽样分布的概念,说明了如何抽取一个简单随机样本,如何根据样本中所收集到的数据建立总体参数的点估计。 总体参数的样本估计量,如 和 ,都是随机变量

39、,它们的分布称为抽样分布。 给出了 和 的具体分布。 简单介绍了中心极限定理。 最后介绍了一些其他的抽样方法。,本讲小结,置信区间、置信度的概念 正态总体均值的置信区间估计 标准差已知 标准差未知 非正态总体均值的置信区间估计 标准差已知 标准差未知 比例的置信区间估计 样本容量的确定,本讲小结,假设检验思想 正态总体均值的假设检验 标准差已知情况(双尾假设检验,单尾假设检验) 标准差未知情况(双尾假设检验,单尾假设检验) 非正态总体均值的假设检验 标准差已知情况(双尾假设检验,单尾假设检验) 标准差未知情况(双尾假设检验,单尾假设检验) 比例的Z检验(双尾假设检验,单尾假设检验) 区间估计与假设检验,The end Thank you very much,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报