收藏 分享(赏)

统计学复习范围整理.doc

上传人:wspkg9802 文档编号:9311713 上传时间:2019-08-01 格式:DOC 页数:6 大小:53.50KB
下载 相关 举报
统计学复习范围整理.doc_第1页
第1页 / 共6页
统计学复习范围整理.doc_第2页
第2页 / 共6页
统计学复习范围整理.doc_第3页
第3页 / 共6页
统计学复习范围整理.doc_第4页
第4页 / 共6页
统计学复习范围整理.doc_第5页
第5页 / 共6页
点击查看更多>>
资源描述

1、1统计学一、概念区别1、 描述统计和推断统计描述统计:指搜集、整理、分析并提供统计资料的理论和方法。主要任务是使反映客观事物的统计数据可以一目了然,条理清晰,使用方便,可以说明现象的数量特征和数量关系。推断统计:是只依据样本资料推断总体特征的技术和方法,包括参数估计和假设检验的方法。关系:描述统计是推断统计的前提,推断统计是描述统计的发展2、 抽样调查和典型调查抽样调查是指根据随机原则从调查总体中抽取部分单位进行观察并根据其结果推断总体数量特征的一种非全面调查的方法。抽样调查可节省人力、物力,减少调查质量,因而应用广泛。典型调查是根据调查的目的和要求,在对研究对象进行全面分析的基础上,有意识地

2、选择部分有代表性的单位进行调查,它是一种非全面调查。特点:即调查单位是在对调查对象全面分析的基础上有意识地选择出来的一种深入细致的调查方法。区别:抽样调查是从总体中随机地抽取部分单位进行调查,典型调查则是从总体中有意识地选择部分单位作为调查的对象。3、 中位数和众数中位数是一种按其在数列中的特殊位置而决定的平均数。把总体各单位标志值按大小顺序排列后,处在中点位次的标志值就是中位数,它将全部标志值分成两个部分,一半标志值比它大,一半标志值比它小,而且比它大的标志值个数和比它小的标志值个数相等。众数也是一种位置平均数,是指总体单位中,标志值出现次数最多的那个数值。单项数列中,频数最多组的标志值就是

3、众数。但在组距数列的条件下,先要确定众数所在组,然后计算以求得近似的众数值。4、 方差和标准差(公式见书本第 页)方差 的平方=(X-X 的平均)的平方/N 将方差开平方,得到的即为标准差。标准差也称为均方差。=样本统计量:从总体中抽出的部分单位总体参数:研究对象的全部单位无论是总体还是样本,都可以用诸如平均数、中位数、众数、比率(或成数)以及标准差和方差等集中趋势指标和离散趋势指标来描述他们的特征。当他们用来描述样本的特征时,称为样本统计量;当他们用来描述总体特征时,称为总体参数。5、 随机抽样和判断抽样随机抽样是按随机原则,即按概率规律抽取样本,在总体中所有单位被抽中的机会是均等的。被抽中

4、的样本单位数即样本容量不带任何个人或集体的主观意见。被选的概率可以事先确定,抽样所出现的误差可以通过概率理论加以测量并确定在一定范围之内。判断抽样是一种非随机抽样,它是根据个人或集体的设想或经验,从总体中有目的地抽取样本。采用这种方法往往是由于人力、物力和财力条件以及时间的限制所致。当然,要想2使判断抽样获得比较好的效果,其条件必须是抽样人具有丰富的关于总体的专业知识。但是,由于判断抽样是凭主观设想和判断抽取样本的,因此抽样的结果就不能用概率方法来加以分析。这是随机抽样和判断抽样的根本区别。6、 非抽样误差和抽样误差非抽样误差是指在调查登记过程中发生的误差和由于主观因素破坏了随机原则而产生的系

5、统性的偏差。在全面调查的抽样调查中,都存在着登记性误差,系统性的偏差也是有人为因素所致。因此,这种非抽样误差往往与调查员的训练水平和工作态度有关,通过努力是可以避免这种误差的。抽样误差是指由于抽样的随机性而带来的偶然的代表性误差,不包括登记性误差和不遵守随机原则造成的偏差。总的来说,抽样误差是进行抽样调查所固有的误差,由于从总体中按随机原则抽取的样本,其结构不可能和总体完全一致,因而样本平均数或比率与总体平均数或比率之间必然会发生误差。抽样误差是具有随机性质的误差,根据抽样结果而作出的决断就有脱离实际而遭受一定损失的风险。但是,一般来说,抽样误差同样受大数定律的支配,因此,我们可运用概率统计的

6、理论和方法把误差控制在最小的限度,从而对总体参数作出科学的推断或估计。7、 类型抽样和整群抽样类型抽样又称分类抽样或分层抽样。它是先将全及总体中的所有单位按某一主要标志分组,然后在各组中采用纯随机抽样或等距抽样方式,抽取一定数目的调查单位构成所需的样本。采取这种方法,由于各单位之间的差异因划类或分层而缩小,这就比较容易选 出有代表性的样本。这种方法最适宜于总体情况比较复杂,各类型或层次之间的差异较大,而总体单位又较多的情形。整群抽样是在全及总体中以群(或组)为单位按绩随机抽样方式或等距抽样方式,抽取若干群(或组) ,然后对所抽中的各群(或各组)中的全部单位一一进行调查。8、 重复抽样和不重复抽

7、样重复抽样就是把已经抽取出来的总体仍旧放回原来的一般总体中,再进行第二次抽取,把第二次抽取出来的总体单位仍放回原来的一般总体中,再进行第三次抽取等。这样在每次抽取时,使已补抽中的总体单位有被重复抽中的可能,总体单位数始终保持不变,而各个单位有被抽选的机会也先后等同。不重复抽样则是将已经抽选出来的单位数不再放回去,而从剩下的总体中抽选,就是说总体中的每个单位只能被抽中一次,不会被重复抽选出来, (如等距抽样和整群抽样等) ,都属于不重复抽样。9、 点估计和区间估计,各举一例说明区别点估计是根据样本数据计算的一个估计值。例如,要估计一批产品的平均使用寿命,可以从总休整 抽取一个样本并计算这个样本数

8、值来估计这一批产品的平均寿命。假如计算出的平均寿命是 1000 小时,用这个数值估计这一批产品的平均寿命,就是点估计。区间估计是通过样本来估计总体参数可能位于的区间。例如,某批产品的平均寿命为 1000小时,这是对该批产品平均寿命参数的点估计值,仅靠这样一个点估计值往往是不够的。这是由于该批产品的使用寿命若近似地服从正态分布,那么,将会有一半产品的使用寿命数达不到总体平均数的标准因此,必须提出该产品使用寿命的上限和下限,即给出一个可以控制的范围,从而使这一范围能够承担起必要的风险。如果说,该产品的平均使用寿命3在 800 小时1200 小时之间,这就是它的区间估计值。10、什么是假设检验假设检

9、验就是对总体参数所做的一个假设开始,然后搜集样本数据,计算出样本统计量,进而运用这些数据测定假设的总体参数在多大程度上是可靠的,并作出承认还是拒绝该假设的判断。11、第类错误和第类错误,在具体问题中阐述清楚。例如:一个被告正在受到法庭的审判。先假定被告是无罪的,记为 H0:被告是无罪的,H0 称为原假设或零假设。另一个可供选择的假设记作 H1:被告是有罪的。H1 称为备择假设或替代假设。对原假设 H0 来说,存在 4 种情况:H0 为真,即被告是无罪的,陪审团也确认他无罪,接受 H0,从而他们作出了正确的决断;H0 为真,即被告是无罪的,但陪审团确认他是有罪的,拒绝 H0,因此作出了错误的决断

10、;H0 不真,即被告是有罪的,陪审团也确认他有罪,拒绝 H0,因此作出了正确的决断;H0 不真,即被告是有罪的,但陪审团却确认他无罪,接受 H0,因此作出了错误的决断。在上述第和种可能情况下,陪审团作出了正确的决策。在第和种可能情况下,决断错误。当 H0 本来为真时,却也可能错误地否定了,在统计上这种否定真实原假设的错误称为第类错误,上述第种可能情况就属这类错误。另一种可能犯的错误是当原假设H0 非真时作出接受 H0 的选择,这种错误称为第类错误。上述第 种可能情况就属于这类错误。对原假设采取的行动与假设本身真伪的关系自然状态对假设 H0 采取的行动 H0 为真(无罪) H0 为伪(有罪)接受

11、 H0拒绝 H0决断正确第类错误第类错误决断正确二、问答题:1、什么是普查?普查要求和原则是什么?普查为什么要有这些要求?答:普查是专门组织的一次性全面调查。搜集的资料表明某一现象在某一时点或某一时期的情况,时间性要求很强。普查工作多在全国或较大范围内进行,需要动员大量人力、物力和财力。因此,只有需要摸清国家重要的国情、国力时,才有可能和必要在全国或较大范围内组织普查。普查作为一种一次性的全面调查,对资料的准确性和时效性要求高。普查的面广量大,要求有更多的集中领导和统一行动。在组织普查工作中还必须注意以下几点:(1)规定统一的标准时点。标准时点是指对被调查对象登记时所依据的统一时点。这个时点一

12、经确定,所有调查资料都要反映这一时点上的状况,以避免搜集资料时因情况变动而产生重复登记和遗漏的现象。(2)确定统一的普查期限。在普查范围内各调查单位或调查点尽可能同时进行普查,并尽可能在最短的期限内完成,以便在方法上或步调上保持一致性,以保证资料的准确性的时效性。(3)规定普查的项目和指标。普查项目和指标一经规定,不准任意改变或增减,以免影响汇总综合,降低资料质量。同一种普查,每次项目和指标应力求一致,并按一定的周期进行,以便更好地进行历次调查资料的对比分析及观察某种现象变化发展的情况。42、抽样的概念和特点。举例说明抽样在工商管理中的运用。抽样就是从所研究的对象中随机地取出其中一部分来观察,

13、由此而获得有关总体的信息。抽样的 3 个特点:(1) 遵守随机原则。随机原则是指在抽样时每个单位有同等被抽中的机会,只有遵守随机原则,才能使抽取的部分单位具有充分的代表性。(2) 推断被调查现象的总体特征。抽样的最终目的是根据样本数据推断被调查现象的总体特征。(3) 计算推断的准确性和可靠性。我们可把推断的误差控制在一定的精确程度和可靠程度上,以满足实际工作的需要。鉴于抽样的上述特点,它在工商管理领域具有极其广泛的应用,具体体现在:(1) 当某些现象不可能采用全面调查时,可以利用抽样作出推断。有些现象要经过破坏性或消耗性的实验才能了解其情况,如灯泡的使用寿命和轮胎的行驶里程等都要作破坏性的试验

14、,无法采用全面调查。对于某些无限总体不能采用全面调查,只能从中抽出样本进行检验。如检查大批量生产的某种小零件的质量。(2) 当某些现象没有必要采用全面调查时,可利用抽样作出推断。例如对城市居民的家计调查和市场购买力调查等,可采用抽样方法。可节省大量的人力物力和财力,并能得到事半功倍的效果。(3) 抽样调查和全面调查结合,可以相互补充,也可以对全面资料起到检验核对的作用。(4) 对于某些总体的假设需要依靠抽样法进行假设检验。如要检验一项工艺改革方案实施以后,是否收到明显的效果,就需要对总行进行假设检验,然后利用抽样方法判断这一假设的真伪,以便做出决断。(5) 它可用于现代化工业大批量生产过程中的

15、产品质量控制。在连续大量生产产品过程进行抽样检验,观察工序过程是否正常,便于及时采取措施,预防废次品的产生。3、总体平均数区间估计有哪些步骤?(公式等见 P94 页)答:(1)确定置信水平,即可靠性或把握程度。一般来说对于估计要求比较精确的话,置信程度也要求高些,在社会经济现象中通常用 95%就可以了。(2)根据置信度并利用标准正态分布表确定 z 值。(3)抽取一个容量为 n 的样本。(4)算出样本平均数(上加一横)和标准差 x。在重复抽样时,样本平均数的标准差为x=n,有限总体不重复抽样时, 。(5)构造置信区间 。4、样本容量确定的重要意义,决定样本大小的因素有哪些?答:在实际设计抽样方案

16、中有一个重要的问题,就是在特定的情况下应该用多大的样本。如果使用一个比需要大的样本,就会浪费资料;如果样本太小,就不能达到分析的目的。决定样本大小的因素有 3 点:受总体方差 2 数值大小的影响。总体方差大,则应多抽一些样本容量,反之,则可少抽一些。当然,当总体方差为 0 时,那么只需抽出其中一个就能代表总体。问题是实际工作中我们往往不知道总体方差,因而必须作试验性调查,或以过去的历史资料作参考。可靠性程度的高低。要求可靠性越高,所必需的样本容量就越大。也就是说,为获得所需精度而指定的概率越大,所需要的样本容量就越大。5允许误差的大小。这主要由研究的目的而定。若要求推断比较精确,允许误差应该低

17、一些,随之抽取的样本容量也要求多一些;反之,若允许误差可以大一些,样本容量也可以少一些。5、假设检验的一般程序(论述题)(1)根据研究问题的需要提出假设,包括原假设 H0 和备择假设 H1。原假设必须包括等号在内,而备择假设则视问题的性质在、三者之中选其一。检验结果仅有 2 种可能性,如果接受原假设,就必须拒绝备择假设,这时,可能会犯第类错误,而第类错误往往是未知的。所以接受 H0 时,其确切的含义应该是,根据样本值尚不能推翻原假设,但不能保证 H0 为真。如果拒绝原假设,就必须接受备择假设,这时可能犯错误的概率为 。(2)找出检验的统计量及其分布。假设确立后,要决定接受还是拒绝,都是根据某一

18、统计量出现的数值,从概率意义上来判断的。这个统计量服从什么样的分布,是由许多因素决定的,如统计量是样本平均数、样本比例或样本方差等,还要看是大样本还是小样本,是否知道总体方差等。(3)规定显著性水平 ,即选择所允许犯第类错误的概率。 确定后,拒绝区域也就随之而定。如果拒绝区域在两侧,则为双侧检验,2 边各占 2 为拒绝区域的面积;如果拒绝区域在曲线一侧,则为单侧检验,左边或右边 的面积为拒绝区域的面积。 到底取多大合适取决于犯第类错误和第类错误后产生的后果及人们所需付出的代价。如果 值定得很小,就要冒接受一个不真实的原假设的较大 概率的风险;反之,如果 值定得很大,则要冒拒绝一个真实的原假设所

19、带来的风险。因此必须根据问题的性质选择一个合适的 。常用的 取 0.05 或 0.01。(4)确定决策规则。在确定了显著水平 以后,根据统计量的分布就可以规定决策规则,找出接受区域和拒绝区域的临界值。例如,在总体平均数假设检验中,当 =0.05 时,双侧检验标准正态分布 z 的 2 的临界值为1.96,大于 1.96 或小于-1.96 就拒绝 H0;反之,就接受 H0。(5)根据样本数据计算的统计量的数值并由此作出决策。如果统计量的值落在拒绝区域内(包括临界值) ,就说明原假设与样本描述的情况有显著差异,应该拒绝原假设。如果落在接受区域内,说明样本和原假设描述的情况的差异是不显著的,应该接受原

20、假设。一般情况下,要否定原假设 H0,只要一个反例就足够了。否定了 H0,也就避免了第类错误,所以根据被否定的原假设做出的决策就具可靠性。6、举例说明点估计和区间估计有何区别?点估计是根据样本数据计算的一个估计值,即从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计。例如:用样本均值作为总体未知均值的估计值就是一个点估计;要估计一批产品的平均使用寿命,可以从总体中抽取一个样本并计算这个样本数值来估计这一批产品的平均寿命,假如算出平均寿命是 1000 小时,用这个数值估计这一批产品的平均寿命,就是点估计。区间估计通过样本来估计总体参数可能位于的区间。给出一个随机区间并指

21、出以多大的概率包含未知参数。例如某批产品的平均使用寿命为 1000 小时,这是对该批产品平均寿命参数的点估计值,仅靠这样一个点估计值往往是不够的。这是由于该批产品的使用寿命近似的服从正态公布,那么,将会有一半产品的使用寿命数达不到总体平均值的标准。因此,必须提出该产品使用寿命的上限和下限,即给出一个可以控制的范围,从而使这一范围能能够承担起必要的风险。如果我们说,该产品的平均寿命在 800 小时1200 小时之间,这就是它的区间估计。三、计算题61、课件第八章中总体均值的置信区间 ( 已知)和两个总体均值之差的估计 (已知)的实例。2、课件第九章总体方差已知时的均值检验(双尾 Z 检验)的实例。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报