1、1统计学复习要点简答题:1统计数据可以分为哪几种类型?不同类型的数据各有什么特点?P5答:1.按照所采用的计量尺度不同,可以将统计数据分为分类数据,顺序数据和数值型数据。按照统计数据的收集方法,可以将统计数据分为观测数据和实验数据。按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。2.分类数据和顺序数据说明的是事物的物质特征,通常用文字表述,其结果均表现为类别。数值型数据说明的是现象的数量特征,通常用数值来表现。观测数据是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。实验数据则是在实验室中控制对象而收集到的数据。截面数据通常是在不同的空间获得
2、的,用于描述现象在某一时刻的变化情况。时间序列数据是按时间顺序收集到的,用于描述现象随时间变化的情况。2概率抽样的含义及其特点。P17答:概率抽样也称随机抽样,是指遵循随机原则进行的抽样。它具有以下几个特点:抽样时是按一定的概率以随机原则抽取样本。每个单位被抽中的概率是已知的,或是可以计算出来的。当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。3直方图与条形图有何区别? P65答:直方图与条形图的区别有:首先,条形图是用条形的长度表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均
3、有意义。其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。最后,条形图主要用于表示分类数据,而直方图则主要用于表示数值型数据。4制作统计表应该注意哪几个问题?P77 P75答:制作统计表时应考虑以下几点:要合理安排统计表的结构,比如行标题,列标题,数字资料的位置应安排合理。表头一般应包括表号,总标题和表中数据单位等内容。表中的上下两条横线一般用粗线,中间的其他线要用细线,这样使人看起来清楚,醒目。一张好的图表应显示好数据,让读者把注意力集中在图形的内容上,而不是制作图形的程序上,避免歪曲,强调数据之间的比较,服务于一个明确的目的,有对图形的统计描述和文字说明。5
4、简述时间序列的构成要素。答:时间序列指将某一统计指标数据按照时间顺序排列起来而形成的统计序列。时间序列的构成要素有时间要素和数据要素,时间要素指现象所属的时间,而2数据要素指的是不同时间上的统计数据。6为什么要计算离散系数? P102答:方差和标准差是反映数据分散程度的绝对值,其数值的大小一方面手本身水平高低的影响,也就是与变量的平均数大小有关,变量值绝对水平高,离散程度的测度值自然也大,绝对水平小的离散程度测度值自然也就小;另一方面,它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。所以对于平均水平不同或计量单位不同的不同组别的变量值,是不能用标准差直接
5、比较其离散程度的。为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。7简述众数,中位数,平均数的特点和应用场合。P86 P88 P91答:众数是一组数据中出现次数最多的变量值。主要用于测度分类数据的集中趋势,也适用于作为顺序数据以及数值型数据集中趋势的测度值。一般情况下,只有在数据量较大的情况下,众数才有意义。中位数是一组数据排序后处于中间位置上的变量值,主要用于测度顺序数据当然也适用于作为数值型数据的集中趋势,但不适用于分类数据。平均数是一组数据相加后除以数据的个数得到的结果,主要适用于数值型数据,而不适用于分类和顺序数据。8简述平稳序列与非平稳序列的含义。 P38
6、6答:时间序列可以分为平稳序列和非平稳序列两大类。平稳序列是基本不存在趋势的序列。这类序列中的各观察值基本上在某个固定的水平上波动,虽然在不同时间段波动的程度不同,但并不存在某种规律,其波动可以看成是随机的。非平稳序列是包含趋势,季节性或周期性的序列,它可能只含有其中的一种成分,也可能是几种成分的组合。因此,非平稳序列由可以分为有趋势的序列,有趋势和季节性的序列,几种成分混合而成的复合型序列。单选 2 分/15 题 判断 1 分/10 题 简答 10 分/2 题计算题 15 分/2 题+10 分/1 题,一共 3 题3第一章1理解“总体” , “样本” , “变量” P7-P9第 2 章2理解
7、“简单随机抽样” , “分层抽样” , “整群抽样” , “系统抽样” P183理解“非抽样误差”P35 和“误差的控制”P39第 3 章4看一下品质数据的整理与展示,注重“分类数据的整理与展示” P525 “数据型数据的整理与展示” P61 注重数值型数据的图示。第 4 章6.集中趋势的度量:理解众数,中位数,分位数 P86-P887.加权平均数的公式 P928.组中值的平均数计算,例题 P929.标准差公式 P10010.标准分数公式 P10111.离散系数公式 P10312.当 K 取不同值时表示的含义 P107第 7 章13.点估计与区间估计 P17714.理解置信区间饿 3 点 P1
8、7915.评价估计量的标准:无偏性,有效性,一致性(理解) P18116.总体均值的区间估计 P18317.例题 7.2 P18418.不同情况下总体均值的区间估计(表格) P18619.总体比例的区间估计 P18720.例题 7.4 P187 例题 7.7 P191 例题 7.8 P19221.样本量的确定 P201第 8 章22.理解“两类错误”的含义 P21323假设检验的流程 P215-P217 (不考计算,单选或判断)24左单侧检验 右单侧检验 (单选,判断)第 11 章25变量间关系的度量 P31226散点图 含义 P314 不同形态的散点图代表的意思 P31527相关系数公式 P31728相关系数的性质 P31829一元线形回归方程 P323430估计的回归方程 P32331解方程组的公式: P32432时间序列的描述性分析 重点 P388-P391