1、一、单项选择题1.根据样本计算的用于推断总体特征的概括性度量值称作(参数)A.参数 B.总体 C.样本 D.统计量2.只能归于某一类别的非数字型数据称为(分类数据)A.分类数据 B.顺序数据 C.数值型数据 D.数值型变量3.只能归于某一有序类别的非数字型数据称为(顺序数据)A.分类数据 B.顺序数据 C.数值型数据 D.数值型变量4.用来描述样本特征的概括性数字度量称为(统计量)A.参数 B.统计量 C.变量 D.变量值5.为了调查某校学生的购书费用支出,从全校抽取 4 个班级的学生进行调查,这种调查方法是(整群抽样)A.简单随机抽样 B.系统抽样 C.分层抽样 D.整群抽样6.为了调查某校
2、学生的购书费用支出,从男生中抽取 60 名学生调查,从女生中抽取 40 名学生进行调查,这种调查方法是(分层抽样)A.简单随机抽样 B.整群抽样 C.系统抽样 D.分层抽样7.经验法则表明,当一组数据对称分布时,在平均数加减 1个标准差的范围之内大约有(68%)A.68% B.95% C.99% D.100%8.经验法则表明,当一组数据对称分布时,在平均数加减 2个标准差的范围内大约有(95%)A.68% B.95% C.99% D.100%9.离散系数的主要用途是(比较多组数据的离散程度)A.反映一组数据的离散程度 B.反映一组数据的平均水平 C.比较多组数据的离散程度 D.比较多组数据的平
3、均水平10.比较两组数据的离散程度最适合的统计量是(离散系数)A.极差 B.平均差 C.标准差 D.离散系数11.峰态通常是与标准正态分布相比较而言的,如果一组数据服从标准正态分布,则峰态系数的值(等于 0)A.等于 0 B.大于 0 C.小于 0 D.等于 112.如果峰态系数 k0,表明该组数据是(尖峰分布)A.尖峰分布 B.扁平分布 C.左偏分布 D.右偏分布13.某居民小区准备采取一项新的物业管理措施,为此,随机抽取了 100 户居民进行调查,其中表示赞成的有 69 户,表示中立的有 22 户,表示反对的有 9 户,则该组数据的中位数是(赞成)A.赞成 B.69 C.中立 D.2214
4、.某班共有 25 名学生,期未统计学课程的考试分数分别为68、73、66、76、86、74、61、89、65、90、69、67、76、62、81、63、68、81、70、73、60、87、75、64、56,那么该班考试分数的下四分位数和上四分位数分别是(64.5和 78.5)A.64.5 和 78.5 B.67.5 和 71.5 C.64.5 和 71.5 D.64.5 和67.515.某行业中随机抽取 10 家企业,第一季度的利润额(单位:万元)分别是:72、63.1、54.7、54.3、29、26.9、25、23.9、23、20,该组数据的中位数为(27.95)A.28.46 B.30.2
5、0 C.27.95 D.28.1216.一组数据的离散系数为 0.4,平均数为 20,则标准差为(8)A.80 B.0.02 C.4 D.8方差: ;离散系数:1)(22nxsnii xsv17.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的均值为()A. B. C. D.X2n218. 根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的方差为( )n2A. B. C. D.X2n219.假设总体服从均匀分布,从此总体中抽取容量为 36 的样本,则样本均值的抽样分布(近似正态分布)A.服从非正态分布 B.近似正态分布 C.服从
6、均匀分布 D.服从 分布220.总体均值为 50,标准差为 8,从此总体中随机抽取容量为 64 的样本,则样本均值的抽样分布的均值和标准误差分别为(50,1)A.50,8 B.50,1 C.50,4 D.8,821.当正态总体的方差未知时,在大样本条件下,估计总体均值使用的分布是(正态分布)A.正态分布 B.t 分布 C. 分布 D.F 分布 222.当正态总体的方差未知时,在小样本条件下,估计总体均值使用的分布是(t 分布)A.正态分布 B.t 分布 C. 分布 D.F 分布223.根据两个匹配的小样本估计两个总体均值之差时,使用的分布是(t 分布)A.正态分布 B.t 分布 C. 分布 D
7、.F 分布224.估计两个总体方差比的置信区间时,使用的分布是(F分布)A.正态分布 B.t 分布 C. 分布 D.F 分布225.一种零件的标准长度 5cm,要检验某天生产的零件是否符合标准要求,建立的原假设和备择假设应为(H0:=5,H1: 5)A.H0:=5,H1: 5 B.H0:5,H1: 5 C.H0:5,H1: 5 D.H0:5,H1: 526.一项研究表明,中学生中吸烟的比例高达 30%,为检验这一说法是否属实,建立的原假设和备择假设应为(H0: 30%,H1: 30%)A.H0:=30%, H1: 30% B.H0: 30% ,H1: 30% C.H0: 30%,H1: 30%
8、 D. H0: 30%,H1: 30%27.列联分析是利用列联表来研究(两个分类变量的关系)A.两个分类变量的关系 B.两个数值型变量的关系 C.一个分类变量和一个数值型变量的关系 D.两个数值型变量的分布28.设 R 为列联表的行数,C 为列联表的列数,则 分布的2自由度为((R-1)(C-1))A.R B.C C.RC D.(R-1)(C-1)29.方差分析的主要目的是判断(分类型自变量对数值型因变量的影响是否显著)A.各总体是否存在方差B.各样本数据之间是否有显著差异C.分类型自变量对数值型因变量的影响是否显著D.分类型因变量对数值型自变量的影响是否显著30.组间误差是衡量不同水平下各样
9、本数据之间的误差,它(既包括随机误差,又包括系统误差)A.只包括随机误差 B.只包括系统误差 C.既包括随机误差,又包括系统误差 D.有时包括随机误差,有时包括系统误差31.组内误差是衡量某一水平下样本数据之间的误差,它(只包括随机误差)A.只包括随机误差 B.只包括系统误差 C.既包括随机误差,又包括系统误差 D.有时包括随机误差,有时包括系统误差32.单因素方差分析是指只涉及(一个分类型自变量)A.一个分类型自变量 B.一个数值型自变量 C.两个分类型自变量 D.两个数值型因变量33.双因素方差分析涉及(两个分类型自变量)A.两个分类型自变量 B.两个数值型自变量 C.两个分类型因变量 D
10、.两个数值型因变量34.在方差分析中,数据的误差用平方和来表示的,其中反映一个样本中各观测值误差大小的平方和称为(组内平方和)A.组间平方和 B.组内平方和 C.总平方和 D.水平项平方和35.在方差分析中,数据的误差用平方和来表示的,其中反映各个样本均值之间误差大小的平方和称为(组间平方和)A.误差项平方和 B.组内平方和 C.组间平方和 D.总平方和36.如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,称为两个变量之间为(完全相关关系)A.完全相关关系 B.正线性相关关系 C.非线性相关关系 D.负线性相关关系37.如果相关系数 r0,则表明两个变量之间(不存在线性相关关系
11、)A.相关程度很低 B.不存在任何关系 C.不存在线性相关关系 D.存在非线性相关关系38.在一元线性回归方程中,回归系数 的实际意义是(当ix 变量 1 个单位时,y 增加的总数量)A.当 x=0 时,y 的平均变动数量B.当 x 变动 1 个单位时,y 的平均变动数量C.当 x 变动 1 个单位时,y 增加的总数量D.当 y 变动 1 个单位时,x 的平均变动数量39.对不同年份的产品成本拟合的直线方程为,回归系数 表示(时间每增加xy75.128075.11 个单位,产品成本平均下降 1.75 个单位)A.时间每增加 1 个单位,产品成本平均增加 1.75 个单位B.时间每增加 1 个单
12、位,产品成本平均下降 1.75 个单位C.产品成本每变动 1 个单位,平均需要 1.75 年时间D.时间每减少 1 个单位,产品成本平均增加 1.75 个单位40.说明回归方程拟合优度的统计量是(判定系数)A.相关系数 B.回归系数 C.判定系数 D.估计标准误差41.各实际观测值(yi)与回归值 ( )的离差平方和称为iy(残差平方和)A.总变差平方和 B.残差平方和 C.回归平方和 D.判定系数42.回归平方和占总平方和的比例称为(判定系数)A.相关系数 B.回归系数 C.判定系数 D.估计标准误差43.若两个变量存在负线性相关关系,则建立的一元线性回归方程的判定系数 R2 的取值范围是(
13、 0,1)A.0,1 B.1,0 C.1,1 D.小于 0 的任意数44.若变量 x 与 y 之间的相关系数 r0,则下列结论中正确的是(判定系数 R2=0)A.判定系数 R2=1 B.判定系数 R2=0 C.回归系数 1D.估计标准误差 se045.在多元线性回归方程 中,回ki xy10归系数 表示( 其他变量不变的条件下,自变量 xi 变动 1i个单位时,因变量 y 的平均变动额为 )iA.自变量 xi 变动 1 个单位时,因变量 y 的平均变动额为 iB.其他变量不变的条件下,自变量 xi 变动 1 个单位时,因变量 y 的平均变动额为 iC.其他变量不变的条件下,自变量 xi 变动
14、1 个单位时,因变量 y 的变动总额为 iD.因变量 y 变动 1 个单位时,因变量 xi 的变动总额为 i46.设在多元线性回归方程 中,ki xy10若自变量 xi 的回归系数 的取值接近 0,这表明(自变量ixi 对因变量 y 的影响不显著)A.因变量 y 对自变量 xi 的影响不显著B.因变量 y 对自变量 xi 的影响显著C.自变量 xi 对因变量 y 的影响不显著D.自变量 xi 对因变量 y 的影响显著47.指数平滑法适合于预测(平稳序列)A.平稳序列 B.非平稳序列 C.有趋势成分的序列 D.有季节成分的序列48.移动平均法适合于预测(平稳序列)A.平稳序列 B.非平稳序列 C
15、.有趋势成分的序列 D.有季节成分的序列49.用最小二乘法拟合直线趋势方程为 ,若 为tbY101负数,表明该现象随着时间的推移呈现(下降趋势)A.上升趋势 B.下降趋势 C.水平趋势 D.随机波动50.对某一时间序列拟合的直线趋势方程为 ,xt10如果 b1 的值等于 0,则表明该序列(没有趋势)A.没有趋势 B.有上升趋势 C.有下降趋势 D,有非线性趋势二、简答题1.简要区别描述统计与推断统计?答:描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等方法。推断统计是研究如何利用样本数据来推断总体特征的统计方法。2.一组数据的分布特征可以从哪几个方面进行测度?答:数据分布特征一般可
16、从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。3.在列联分析中,简述 统计量的计算步骤?24.简述单因素方差分析的基本步骤?(1)提出原假设(2)构造检验的统计量计算各样本的均值计算全部观测值的总均值计算各误差平方和:总平方和(SST)=组间平方和(SSA)+ 组内平方和(SSE)计算统计量(3)统计决策(4)方差分析表(5)用 Excel 进行方差分析5.简述双因素方差分析的基本步骤?(1)提出假设(2)构造检验的统计量(3)统计决策6.简述方差分析的基本思路和原理?(1)图形描述(2)误差分解(3)误差分析7
17、.简述 分布、t 分布、F 分布及正态分布之间的关系?28.回归分析主要解决哪几方面的问题?(1)从一组样本数据出发,确定变量之间的数学关系式。(2)对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著。(3)利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的可靠程度。9.回归分析与相关分析的区别?(1)相关分析中,变量 x 变量 y 处于平等的地位;回归分析中,变量 y 称为因变量,处在被解释的地位,变量 x 称为自变量,用于预测因变量的变化。(2)相关分析中所涉及的变量 x 和 y 都是随
18、机变量;回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量,也可以是非随机的确定变量。(3)相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制。10.简述一元线性关系的检验步骤?(1)提出假设(2)计算检验统计量 F(3)作出决策三、名词解释1.拉氏价格指数:以现期价格购买一个基期选定的商品组合的成本相对于以基期价格购买同一组合的成本的比值。2.帕氏价格指数:以现期价格购买一个现期选定的商品组合的成本相对于以基期价格购买同一组合的成本的比值。3.集中趋势:指一组数据向某一中心值靠拢的程度,它反映了一
19、组数据中心点的位置所在。4.置信区间:由样本统计量所构造的总体参数的估计区间。5.置信水平:将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例。6.弃真错误:当原假设为真时拒绝原假设,所犯的就称为第一类错误,又称弃真错误,即 错误。7.取伪错误:当原假设为假时没有拒绝原假设,所犯的就是第二类错误,又称取伪错误,即 错误。8.多重共线性:当回归模型中两个或两个以上的自变量彼此相关时,则称回归模型中存在多重共线性。9.趋势:是时间序列在长期内呈现出来的某种持续上升或持续下降的变动。10.线性趋势:指现象随着时间的推移而呈现出稳定增长或下降的线性变化规律。11.回归方程:描述因
20、变量 y 的期望值如何依赖于自变量 x的方程方程。12.最小二乘估计:通过使因变量的观测值 与估计值 之iyi间的离差平方和达到最小来估计 和 的方法。0113.判定系数:回归平方和占总平方和的比例。14.估计标准误差:说明实际值与其估计值之间相对偏离程度的指标。15.残差:是因变量的观测值 iy与根据估计的回归方程求出的预测值 iy之差。16.拟合优度:指回归直线对观测值的拟合程度。17.组内误差:来自水平内部的数据误差。18.间接误差:间接测量的误差。19.系统误差:在重复性条件下,对同一被测量进行无限多次测量所得结果的平均值与被测量的真值之差。20.回归模型:描述因变量 y 如何依赖于自
21、变量 x 和误差项 的方程。4、计算题4.2 随机抽取 25 个网络用户,得到他们的年龄数据如下:19 15 29 25 2423 21 38 22 1830 20 19 19 1623 27 22 34 2441 20 31 17 23(1)计算众数、中位数: =19 和 23; =230Me(2)根据定义公式计算四分位数: =19; =26.51Q3(3)计算平均数和标准差: =24;s= =6.65x)(2nxi(4)计算偏态系数和峰态系数:SK= =1.083)2(1snxiK= =0.773424)()( )1(snxii(5)对网民年龄的分布特征进行综合分析:样本数据的均值为 24
22、 岁,但标准差较大,说明网民年龄之间差异较大。从偏态和峰度系数来看,网民年龄呈现右偏尖峰分布。7.11 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为 l00g。现从某天生产的一批产品中按重复抽样随机抽取 50 包进行检查,测得每包重量(单位:g) 如下:每包重量(g) 包数969898100100102233410210410410674合计 50已知食品包重量服从正态分布,要求:(1)确定该种食品平均重量的 95的置信区间。解:大样本,总体方差未知,用 z 统计量; =101.4,s=1.829xzsn0,1N:x置信区间: 22,ssxzxznn =0.95, = =1.9612
23、0.522,ssxzxznn = 1.891.82910.46,0.46550=(100.89,101.91)(2)如果规定食品重量低于 l00g 属于不合格,确定该批食品合格率的 95的置信区间。解:总体比率的估计大样本,总体方差未知,用 z 统计量;p= (50-5)/50=0.91pzn0,1N:置信区间: 221,ppzznn =0.95, = =1.96120.52211,ppzznn = 0.9.0.96,.655 =(0.8168,0.9832)7.18 某居民小区共有居民 500 户,小区管理者准备采取一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了 50 户,
24、其中有 32 户赞成,18 户反对。(1)求总体中赞成新措施的户数比例的置信区间(=0.05),( 为 :户 数 比 例 的总 体 中 赞 成 该 项 改 革 的 ,已 知 : .7051信13.06450.)-.64(19.np)-(z 信%.9z0532/2 0.5/2p(2)如果小区管理者预计赞成的比例能达到 80%,要求估计误差不超过 10%。应抽取多少户进行调查( =0.05 )?621.0)8.(96.)1()(zn.9z.58. 22/ 0./2E应 抽 取 的 样 本 量 为 : ,已 知 :7.20 顾客到银行办理业务时往往需要等待一段时间,而等待时间的长短与许多因素有关,比
25、如,银行业务员办理业务的速度,顾客等待排队的方式等。为此,某银行准备采取两种排队方式进行试验,第一种排队方式是:所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取 10 名顾客,他们在办理业务时所等待的时间(单位:分钟 )如下:方式 1 6.5 6.6 6.7 6.8 7.1 7.3 7.4 7.7 7.7 7.7方式 2 4.2 5.4 5.8 6.2 6.7 7.7 7.7 8.5 9.3 10要求:(1)构建第一种排队方式等待时间标准差的 95置信区间。解:估计统计量: 211nSn样本标准差: =0.2
26、2722s置信区间: 22211nSnS=0.95,n=10,1= =19.02,220.59= =2.712n.72221,Sn= 90.7.,=(0.1075,0.7574)因此,标准差的置信区间为(0.3279,0.8703)(2)构建第二种排队方式等待时间标准差的 95置信区间。解:估计统计量: 211nSn样本标准差 =3.31821s置信区间: 2221nSnS=0.95,n=10,= =19.02,2120.59= =2.72n.72221,Sn= 93.8.,07=(1.57,11.06)因此,标准差的置信区间为(1.25,3.33)(3)根据(1)和(2)的结果,你认为哪种排
27、队方式更好?答:第一种方式好,标准差小!8.4 糖厂用自动打包机打包,每包标准重量是 100 千克。每天开工后需要检验一次打包机工作是否正常。某日开工后测得 9 包重量(单位:千克)如下:99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5 已知包重服从正态分布,试检验该日打包机工作是否正常(a005)?解:H 0:100 ;H 1: 100经计算得: 99.9778;S1.21221x检验统计量: -0.0550tsn9.78012当 0.05,自由度 n18 时,查表得 2。/t因为 ,样本统计量落在接受区域,故接受原假设,t2拒绝备择假设,说明
28、打包机工作正常。8.10 装配一个部件时可以采用不同的方法,所关心的问题是哪一个方法的效率更高。劳动效率可以用平均装配时间反映。现从不同的装配方法中各抽取 12 件产品,记录各自的装配时间(单位:分钟)如下:甲:31 34 29 32 35 38 34 30 29 32 31 26乙:26 24 28 29 30 29 32 26 31 29 32 28两总体为正态总体,且方差相同。问两种方法的装配时间有无显著不同(a 005)?解:建立假设 H0: 1 2=0;H 1: 1 20总体正态,小样本抽样,方差未知,方差相等,检验统计量12pxtsn根据样本数据计算,得12, =12,1231.7
29、5, 3.19446,x1s28.6667, =2.46183。222112pnsss 20.960.7168.13262.64812pxtsn当 0.05 时,临界点为 2.074,此题中 ,故21t0.25t t2拒绝原假设,认为两种方法的装配时间有显著差异。8.14 某工厂制造螺栓,规定螺栓口径为 7.0cm,方差为0.03cm。今从一批螺栓中抽取 80 个测量其口径,得平均值为 6.97cm,方差为 0.0375cm。假定螺栓口径为正态分布,问这批螺栓是否达到规定的要求?(=0.05)=7; 720:H21: 025.49.180/3.96/ nx不能拒绝原假设。8.15 有人说在大学
30、中男生的学习成绩比女生的学习成绩好。现从一个学校中随机抽取了 25 名男生和 16 名女生,对他们进行了同样题目的测试。测试结果表明,男生的平均成绩为 82 分,方差为 56 分,女生的平均成绩为 78 分,方差为 49 分。假设显著性水平 =002,从上述数据中能得到什么结论?解:首先进行方差是否相等的检验:建立假设 H0: ;H 1: 212n1=25, =56,n2=16 , =49,s2s 1.14321F5649当 0.02 时,3.294, 0.346。由于24,15F124,5FF ,检验统计量的值落在接受域中,所以接受原假设,说明总体方差无显著差异。检验均值差:建立假设 H0: 1 2=0;H 1: 1 2=0总体正态,小样本抽样,方差未知,方差相等,检验统计量 ,12pxtsn根据样本数据计算,得 25, =16,1282, =56, 78, =491x21s2xs53.308122pn1.71112pxtsn0.02 时,临界点为 2.125,t ,故不能拒绝原12t0.239t假设,不能认为大学中男生的学习成绩比女生的学习成绩好。