1、专业资料WORD 完美格式 下载可编辑统计学题库及题库答案题库 1一、单项选择题(每题 2 分,共 20 分)1、调查时间是指( )A、调查资料所属的时间 B、进行调查的时间 C、调查工作的期限 D、调查资料报送的时间 2、对某城市工业企业未安装设备进行普查,总体单位是( ) 。 A、工业企业全部未安装设备 B、企业每一台未安装设备 C、每个工业企业的未安装设备 D、每一个工业企业 3、对比分析不同性质的变量数列之间的变异程度时,应使用( ) 。A、全距 B、平均差 C、标准差 D、变异系数4、在简单随机重复抽样条件下,若要求允许误差为原来的 2/3,则样本容量( )A、扩大为原来的 3 倍
2、B、扩大为原来的 2/3 倍C、扩大为原来的 4/9 倍 D、扩大为原来的 2.25 倍5、某地区组织职工家庭生活抽样调查,已知职工家庭平均每月每人生活费收入的标准差为12 元,要求抽样调查的可靠程度为 0.9545,极限误差为 1 元,在简单重复抽样条件下,应抽选( ) 。A、576 户 B、144 户 C、100 户 D、288 户6、当一组数据属于左偏分布时,则( )A、平均数、中位数与众数是合而为一的B、众数在左边、平均数在右边C、众数的数值较小,平均数的数值较大D、众数在右边、平均数在左边7、某连续变量数列,其末组组限为 500 以上,又知其邻组组中值为 480,则末组的组中值为(
3、) 。A、520 B、 510 C、 500 D、4908、用组中值代表组内变量值的一般水平有一定的假定性,即( )A、各组的次数必须相等B、变量值在本组内的分布是均匀的C、组中值能取整数D、各组必须是封闭组9、 是来自总体 的样本,样本均值 服从( )分布nX,21 ),(2NXA、 B.、 C.、 D、 ),(2)1,0(),(2n),(2nN10、测定变量之间相关密切程度的指标是( ) A、估计标准误 B、两个变量的协方差 C、相关系数 D、两个变量的标准差 二、多项选择题(每题 2 分,共 10 分)专业资料WORD 完美格式 下载可编辑1、抽样推断中,样本容量的多少取决于( ) 。
4、A、总体标准差的大小 B、允许误差的大小 C、抽样估计的把握程度 D、总体参数的大小 E、抽样组织形式 2、抽样估计中的抽样误差( ) 。 A、是不可避免要产生的 B、是可能通过改进调查方式来消除的 C、是可以事先计算出来的 D、只能在调查结束后才能计算的 E、其大小是可能控制的 3、在什么条件下,加权算术平均数等于简单算术平均数( ) 。A、各组次数相等 B、各组变量值不等 C、变量数列为组距数列 D、各组次数都为 1 E、各组次数占总次数的比重相等4、总体平均数的假设检验方法通常有( )A、 Z 检验法 B、 t 检验法 C、 检验法 2D、 F 检验法 E、 几何检验法5、指出下列分组哪
5、些是属性分组( )A、 人口按性别分组 B、 企业按产值多少分组 C、 家庭收入水平分组 D、 在业人员按文化程度分组 E、 产品按质量等级分组三、填空题(每空 2 分,共 20 分)1、统计分组的关键问题是正确选择 与划分 。2、对某村 6 户居民家庭共 30 人进行调查,所得的结果是,人均收入 400 元,其离差平方和为 480,则标准差是 ,标准差系数是 。3、抽样推断的主要内容有 和 两个方面。4、假设检验中的两类错误分别称为 和 。5、相关系数 r 的取值范围是 到 。四、简答题(每题 5 分,共 20 分)1、众数、中位数、均值的特点与应用场合是什么?2、什么是假设检验的 P 值?
6、如何根据 P 值作出假设检验的结论?3、为什么要计算标准差系数? 4、单因素方差分析的步骤是什么?五、计算题(每题 10 分,共 30 分)1、某班学生统计学原理考试成绩次数分布如下:要求:根据上表资料,计算相应的的数字,填入表中空格。2、根据有关调查,北京市每天每个家庭上网的时间服从正态分布 。现从北京市家2(4,1)N庭中随机抽取 16 户,测得平均每天每户家庭上网时间为 4.5 小时。试在 0.05 的显著性水平下判断北京市家庭上网的时间是否有显著提高?( )0.50.256,96Z3、从 100 家自选商场销售额资料(x,亿元)和利润额(y,亿元)资料计算得知:n=100,X=10,Y
7、=20,X2=1.5,Y2=50,XY=3。根据以上数据,求出利润额对销售额的直线回归方程。专业资料WORD 完美格式 下载可编辑题库 2一、单项选择题(每题 2 分,共 20 分)1、统计学自身的发展,沿着两个不同的方向,形成( )A、描述统计学与理论统计学B、理论统计学与推断统计学C、理论统计学与应用统计学D、描述统计学与推断统计学2、某地区为了掌握地区水泥生产的质量情况,拟对占该地区水泥总产量的 80%的五个大型水泥厂的生产情况进行调查,这种调查方式是( )A 普查 B 典型调查 C 抽样调查 D 重点调查3、用组中值与次数求坐标点连接而成的统计图是( )A 直方图 B 条形图C 曲线图
8、 D 折线图4、离中趋势指标中,最容易受极端值影响的是( )A 极差 B 平均差C 标准差 D 标准差系数5、一组数据的偏态系数为 1.3,表明该组数据的分布是( )A 正态分布 B 平顶分布C 左偏分布 D 右偏分布6、抽样平均误差说明抽样指标与总体指标之间的( )A 实际误差 B 平均误差C 实际误差的平方 D 允许误差7、假设检验是检验( )的假设是否成立。A 样本方差 B 总体指标C 样本方差 D 样本平均数8、用组中值代表组内变量值的一般水平有一定的假定性,即( )A、各组的次数必须相等B、变量值在本组内的分布是均匀的C、组中值能取整数D、各组必须是封闭组9、总体平均数的假设检验方法
9、,在小样本,且方差未知时,通常采用( )A、Z 检验法 B、t 检验法 C、 检验法 D、F 检验法210、年劳动生产率 x(千元)和工人工资 y=10+70x,这意味着年劳动生产率每提高 1 千元时,工人工资平均( )A、增加 70 元 B、减少 70 元 C、增加 80 元 D、减少 80 元二、多项选择题(每题 2 分,共 10 分)1、概率抽样调查 ( )A、是一种非全面调查B、 其目的是根据抽样结果推断总体数量特征C、它具有经济性、时效性、准确性和灵活性等特点D、其调查单位是随机抽取的 E、抽样推断的结果往往缺乏可靠性2、常用的样本指标有( )专业资料WORD 完美格式 下载可编辑A
10、 样本平均数 B 样本成数 C 抽样误差 D 样本方差 E 标准差3、在什么条件下,加权算术平均数等于简单算术平均数( ) 。A、各组次数相等 B、各组变量值不等 C、变量数列为组距数列 D、各组次数都为 1 E、各组次数占总次数的比重相等4、总体平均数的假设检验方法通常有( )A、 Z 检验法 B、 t 检验法 C、 检验法 2D、 F 检验法 E、 几何检验法5、中位数是( )A 由标志值在变量数列中所处的位置决定的B 根据标志值出现的次数决定的C 总体单位水平的平均值D 总体一般水平的代表值E 不受总体中极端数值的影响三、填空题(每空 2 分,共 20 分)1、一个完整的统计工作过程可以
11、划分为、四个阶段。2、当变量数列中算术平均数大于众数时,这种变量数列的分布呈分布;反之,算术平均数小于众数时,变量数列的分布呈分布。3、评价点估计量好坏的标准有、和。4、相关系数,用于反映条件下,两变量相关关系的密切程度和方向的统计指标。四、简答题(每题 5 分,共 20 分)1、离中趋势的指标有哪些(至少列出三个) ,它们之间有何区别?2、影响抽样误差的因素有哪些?3、相关分析和回归分析的联系与区别?4、假设检验一般有哪些步骤?五、计算题(每题 10 分,共 30 分)1、某班级分甲、乙两个学习小组,在统计学考试中,甲小组平均成绩 75 分,标准差 11.5,乙小组成绩资料如表:成绩(分)
12、人数(人)60 以下60-7070-8080-9090 以上25864合计 25(1)计算乙小组的平均成绩。(2)以尽可能精确的方法比较两小组平均成绩的代表性。2、根据历史的统计,某种产品的次品率为 2%。如果要求置信水平为 95.45%的置信区间,专业资料WORD 完美格式 下载可编辑并要求允许误差不超过 4%,应抽取多大的样本?( )(2)95.4%PZ3、从 100 家自选商场销售额资料(x,亿元)和利润额(y,亿元)资料计算得知:n=100,X=10,Y=20,X2=1.5,Y2=50,XY=3。根据以上数据,(1)求出利润额对销售额的直线回归方程;(2)预测当销售额为 0.5 亿元时
13、,利润额在置信度为 95.45%的预测区间(已知预测标准误差为 0.05 亿元) 。题库 3一、单项选择题(每题 2 分,共 20 分)1.某地进行私营商业企业经营情况调查,则调查对象是( )A 该地所有商业企业 B 该地所有私营商业企业C 该地每一私营商业企业 D 该地每一商业企业2. 统计分组的关键问题是( )A 确定分组标志和划分各组界限B 确定组距和组数C 确定组距和组中值 D 确定全距和组距3 用组中值与次数求坐标点连接而成的统计图是( )A 直方图 B 条形图C 曲线图 D 折线图4. 离中趋势指标中,最容易受极端值影响的是( )A 极差 B 平均差C 标准差 D 标准差系数5.
14、所谓大样本是指样本单位数在( )及以上。A 30 个 B 50 个 C 80 个 D 100 个6. 抽样指标与总体指标之间抽样误差的可能范围是( )A 抽样平均误差 B 抽样极限误差C 区间估计范围 D 置信区间7. 原假设为真,我们却拒绝它的概率为( )A 1 B C 1 D 8. 假设检验是检验( )的假设是否成立。A 样本方差 B 总体指标C 样本方差 D 样本平均数9. 下面的函数关系是( )A 销售人员测验成绩与销售额大小的关系B 圆周的长度决定于它的半径C 家庭的收入和消费的关系专业资料WORD 完美格式 下载可编辑D 数学成绩与统计学成绩的关系10. 年劳动生产率 x(千元)和
15、工人工资(元)y=30+70x,这意味着年劳动生产率每提高 1 千元时,工人工资平均( )A 增加 70 元 B 减少 70 元 C 增加 100 元 D 减少 100 元 二、多项选择题(每题 2 分,共 10 分)1.询问调查法有以下几种( )A 访问调查 B 邮寄调查 C 电话调查 D 实验法 E 观察法2.某单位 100 名职工按工资额分为 300 以下、300-400、400-600、600-800、800以上等五个组。这一分组( )A 是等距分组 B 是异距分组 C 末组组中值为 800D 相邻的组限是重叠的 E 某职工工资 600 元,应计在 600-800 元组内3.在各种平均
16、数中,不受极端值影响的平均数是( )A 算术平均数 B 调和平均数C 中位数 D 几何平均数E 众数4.在总体 1000 个单位中,抽取 20 个单位进行调查,下列各项正确的是( )A 样本单位数是 20 个B 样本个数是 20 个C 一个样本有 20 个单位D 样本容量是 20 个E 是一个小样本5.下列哪些变量之间的关系为相关关系( )A 家庭收入与消费支出关系B 圆的面积与它的半径关系C 广告支出与商品销售额关系D 单位产品成本与利润关系E 在价格固定情况下,销售量与商品销售额关系三、填空题(每空 2 分,共 20 分)1、统计学按方法的构成可以分_与_。2、组距式变量数列,根据各组的组
17、距是否相等可以分为_和_。3、直方图是用_的宽度和高度来表示频数分布的图形。4、标准差系数是_与_之比。5、常用的总体指标有_、_、_。四、简答题(每题 5 分,共 20 分)1、统计调查方案包括有哪几个方面的内容?专业资料WORD 完美格式 下载可编辑2、数据的计量尺度分几类?它们之间有什么区别与联系?3、标准差与标准差系数各是什么含义?衡量数据的离散程度时,如何选择?4、必要的抽样数目受哪些因素的影响?五、计算题(每题 10 分,共 30 分)1. 2006 年某月份甲、乙两农贸市场某农产品价格和成交额、成交量资料如下:品种 价格(元/斤) 甲市场成交额 (万元) 乙市场成交量 (万斤)甲
18、 1.2 1.2 2乙 1.4 2.8 1丙 1.5 1.5 1合 计 5.5 4试问哪一个市场农产品的平均价格高?并说明理由。2、某食品厂用自动装袋机包装食品,每袋标准重量为 50 克,每隔一定时间抽取包装袋进行检验。现抽取 10 袋,测得其重量为(单位:克) ;49.8,51,50.5,49.5,49.2,50.2,51.2,50.3,49.7,50.6若每袋重量服从正态分布,每袋重量是否符合要求。(0.05, )0.256t3、某 10 户家庭样本具有下列收入和食品支出(元/天)数据:收入 x 20 30 32 40 45 53 56 58 65 74支出 y 7 9 8 11 12 1
19、4 13 15 17 16试求出以最小二乘法计算的回归方程,并预测当 x=5 时 y 的值。题库 4一、单项选择题(每题 2 分,共 20 分)1、 人口普查的调查单位是( ) 。A .全部人口 B.每个人 C.全部人口数 D.每户家庭;2、将由显著性水平所规定的拒绝域平分为两部分,置于概率分布的两边,每边占显著性水平的二分之一,这是() 。A.、单侧检验 B、双侧检验 C、右单侧检验 D、左单侧检验 3、产品质量的检查应该采用( ) 。A、重点调查的方法; B、典型调查的方法;C、普查的方法; D、抽样检验的方法;专业资料WORD 完美格式 下载可编辑4 某组向上累计次数表示( )A、大于该
20、组上限的次数有多少;B、大于该组下限的次数有多少;C、小于该组上限的次数有多少;D、小于该组下限的次数有多少;5、对正态总体均值进行区间估计时,其它条件不变,置信水平 越大,则置信上限与1置信下限的差( )A、越大 B、越小 C、不变 D、不确定6、在其它条件不变的情况下,如果允许抽样平均误差比原来扩大 2 倍,则样本容量( ) 。A.扩大为原来的 4 倍 B. 扩大为原来的 2 倍C.缩小为原来的二分之一 D. 缩小为原来的四分之一7、某年某地区甲乙两类职工的月平均收入分别为 1060 元和 3350 元,标准差分别为 230 元和 680 元,则职工月平均收入的离散程度 ( )A、甲类较大
21、 B、乙类较大 C、两类相同 D、不确定8、所谓显著水平是指 ( )A、原假设为真时将其接受的概率; B、原假设不真时将其舍弃的概率;C、原假设为真时将其舍弃的概率;D、原假设不真时将其接受的概率;9、在一元线性回归方程 中,b 表示( )yaxA、当 x 增加一个单位时,y 增加 a 的数量;B、当 y 增加一个单位时,x 增加 b 的数量;C、当 x 增加一个单位时,y 的平均增加量;D、当 y 增加一个单位时,x 的平均增加量.10在其他条件相同的前提下:不重复抽样误差( )A、大于重复抽样误差 B、小于重复抽样误差C、等于重复抽样误差 D、与重复抽样误差何者更大无法判定二、多项选择题(
22、每题 2 分,共 10 分)1.频率是( )A 概率 B 各组次数 C 非负数 D 自然数 E 各组的次数占总体单位数的比重2. 下列的表述正确的有( )A. 总体是唯一确定的,样本是随机的专业资料WORD 完美格式 下载可编辑B. 总体指标是确定不变的C. 抽样指标是样本量的函数D. 抽样指标也是随机变量E. 抽样指标是确定不变的3.若一组数据的偏度系数是-0.25,则下列说法正确的有( )A 平均数、中位数与众数是分离的B 众数在左边、平均数在右边C 数据的极端值在右边,数据分配曲线向右延伸D 众数在右边、平均数在左边E 数据的极端值在左边、数据分配曲线向左延伸4. 进行方差分析需要满足的
23、假设条件有( )A 每次试验都是独立进行 B 各样本都来自正态总体 C 各总体的方差相等D 各样本的样本量相等 E 各总体分布相互独立5.人的血压与体重之间存在一定的相关关系,这种相关属于( )A 正相关B 单相关C 负相关D 复相关E 完全相关三、填空题(每空 2 分,共 20 分)1、统计调查按调查对象包括的范围不同可分为_与_。2、测定峰度系数 3 时,次数分布曲线为_;为 3 时,为_;3 时,为_曲线。3、当_时,加权算术平均数等于简单算术平均数。4、总体方差越大,抽样误差就_;总体方差越小,抽样误差_。5、当变量数列中算术平均数大于众数时,这种变量数列的分布呈_分布;反之,算术平均
24、数小于众数时,变量数列的分布呈_分布。四、简答题(每题 5 分,共 20 分)1、什么是统计学?怎样理解统计学与统计数据的关系?2、如何对任意两个总体平均数的代表性进行比较?3、影响抽样误差的因素有哪些?4、什么是假设检验的 P 值?如何根据 P 值来作出假设检验的结论?五、计算题(每题 10 分,共 30 分)专业资料WORD 完美格式 下载可编辑1、随机抽查某企业 100 名职工,其月工资资料如下表 月工资额(百元) 职工数(人)588101012121414184108033合计 100要求:根据表中资料计算职工月工资的平均数、标准差和离散系数。2、从 500 名初中生中随机抽出 100
25、 名测量身高,通过计算得样本身高平均值 X为 1.65 米,样本标准差 s 为 0.073,在概率为 95.45%的保证程度下,对这些初中生的身高作出区间估计。 (2)=0.9545)3、对 9 位青少年的身高 y 与体重 x 进行观测,并已得出以下数据:54.13, 978.2,472x,28x, 0.3xy要求:以身高为因变量,体重为自变量,建立线性回归方程。题库 5一、单项选择题(每题 2 分,共 20 分)1.统计学的方法分为( )A 描述统计学与理论统计学B 理论统计学与推断统计学C 理论统计学与应用统计学D 描述统计学与推断统计学2.某蕊片厂为了掌握该厂的产品质量,拟进行一次质量大
26、检查,这种检查应选择( )A 统计报表 B 重点调查 C 全面调查 D 抽样调查3.下列分组中按品质标志分组的是( )A 人口按年龄分组 B 产品按质量优劣分组C 企业按固定资产原值分组 D 乡镇按工业产值分组4. 在分组时,若有某个数据的值正好等于相邻组的下限时,一般应将其归在( )A 上限所在组 B 下限所在组C 任意一组均可 D 另设新组5.方差是数据中各变量值与其算术平均的( )专业资料WORD 完美格式 下载可编辑A 离差绝对值的平均数 B 离差平方的平均数C 离差平均数的平方 D 离差平均数的绝对值6. 一组数据的偏态系数为-1.3,表明该组数据的分布是( )A 正态分布 B 平顶
27、分布C 左偏分布 D 右偏分布7. 原假设为假,我们却不拒绝它的概率为( )A 1 B C 1 D 8.在简单随机重复抽样条件下,若要求抽样误差为原来的 1/2,则样本容量( )A 扩大为原来的 5 倍 B 扩大为原来的 2 倍C 扩大为原来的 4 倍 D 扩大为原来的 2.5 倍9. 假设检验和区间估计之间的关系,下列说法正确的是( )A 虽然概念不同,但实质相同B 两者完全没有关系C 互相对应关系D 不能从数量上讨论它们之间的对应关系10. 当相关系数 r=0 时,表明( )A 现象之间完全相关 B 相关程度较小C 现象之间完全相关 D 无直线相关关系二、多项选择题(每题 2 分,共 10
28、 分)1.不属于询问调查法有( )A 访问调查 B 邮寄调查 C 电话调查 D 实验法 E 观察法2. 非全面调查是指( )A 普查 B 全面统计报表 C 重点调查 D 典型调查 E 抽样调查3.变量数列中频率应满足的条件是( )A 各组频率大于 1 B 各组频率大于 0C 各组频率之和等于 1 D 各组频率之和小于 1E 各组频率之和大于 14.在 500 位同学中,抽取 100 名同学进行调查,下列各项正确的是( )A 样本单位数是 1000 个B 样本个数是 100 个C 一个样本有 100 个单位D 样本容量是 100 个E 是一个大样本5.下列哪些变量之间的关系为函数关系( )A 家
29、庭收入与消费支出关系专业资料WORD 完美格式 下载可编辑B 圆的面积与它的半径关系C 广告支出与商品销售额关系D 单位产品成本与利润关系E 在价格固定情况下,销售量与商品销售额关系三、填空题(每空 2 分,共 20 分)1、统计数据大体上可分为_与_两种类型。2、数据的计量尺度由低级到高级可以分为_、_、_和_。3、当满足_条件,加权算术平均数等于简单算术平均数。4、参数点估计的方法有_与_。5、相关系数的取值范围是_。四、简答题(每题 5 分,共 20 分)1、简述平均数、众数、中位数三者的特点与应用场合?2、什么是随机原则?在抽样调查中为什么要遵循随机原则?3、什么是离散系数?它的计算有
30、什么意义?4、什么是假设检验的 P 值?如何根据 P 值来作出假设检验的结论?五、计算题(每题 10 分,共 30 分)1.根据下表数据,计算 10 名工人日加工零件数均值、标准差。按零件数分组 人数010 21020 52030 3合计 102、根据过去大量资料,西安市每天每个家庭看电视的时间服从正态分布 。现从西2(4,1)N安市家庭中随机抽取 16 户,测得平均每天每户家庭看电视时间为 4.5 小时。试在 0.05 的显著性水平下判断西安市家庭看电视的时间是否有显著提高?( )0.56Z3、检查 5 位同学统计学的学习时间与成绩分布如下表:每周学习时数x4 6 7 10 13学习成绩y4
31、0 60 50 70 90试求出以最小二乘法计算的回归方程,并预测当每周学习时数为 8 时,统计学成绩。题库 6一、单项选择题(每题 2 分,共 20 分)专业资料WORD 完美格式 下载可编辑1、 研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于( )A、应用统计学 B、描述统计学 C、推断统计学 D、理论统计学2、若各个标志值都扩大 2 倍,而频数都减少为原来的 1/3,则平均数 ( )A、扩大 2 倍 B、减少到 1/3 C、不变 D、减少到 1/23、在处理快艇的 6 次试验数据中,得到下列最大速度值:27、38、30、37、35、31.则最大艇速的均值的无偏估计值为
32、 ( )A、32.5 B、33 C、39.6 D、304、若两个变量的平均水平接近,标准差越大的变量,其 ( )A、平均值的代表性越好 B、离散程度越大 C、稳定性越高 D、离散程度越小5、对正态总体均值进行区间估计时,其它条件不变,置信水平 越小,则置1信上限与置信下限的差( )A、越大 B、越小 C、不变 D、不确定6、方差分析中的原假设是关于所研究因素 ( )A、各水平总体方差是否相等 B、各水平的理论均值是否相等C、同一水平内部数量差异是否相等D、同一水平内部数值相等7、某年某地区甲乙两类职工的月平均收入分别为 1060 元和 3350 元,标准差分别为 230 元和 680 元,则职
33、工月平均收入的离散程度 ( )A、甲类较大 B、乙类较大 C、两类相同 D、不确定8、在假设检验中,若 ,则此检验是 50:,50:10 H( )A、左侧检验 B、右侧检验 C、双侧检验 D、不知道9、某专家小组成员的年龄分别为 29,45,35,43,45,58,他们年龄的中位数为 ( )A、45 B、40 C、44 D、43专业资料WORD 完美格式 下载可编辑10、某次考试学生的考试成绩 近似服从正态分布, ,则可认为X64,78NX有大约 95.45%的学生考试成绩分布的范围是 ( )A、(70,80) B、(70,86) C、(62,94) D、(70,90)二、多项选择题(每题 2
34、 分,共 10 分)1.估计量的评价标准是( )A 无偏性 B 有效性 C 一致性 D 客观性 E 及时性2. 下列哪些属于全面调查( )A 普查 B 全面统计报表 C 重点调查 D 典型调查 E 抽样调查3.下列关于变量数列中频率的说明不正确的是( )A 各组频率大于 1 B 各组频率大于 0C 各组频率之和等于 1 D 各组频率之和小于 1E 各组频率之和大于 14. 总体平均数的假设检验方法通常有( )A Z 检验法 B t 检验法 C 检验法 2D F 检验法 E 几何检验法5.收入与消费存在一定的相关关系,这种相关属于( )A 正相关B 单相关C 负相关D 复相关E 完全相关三、填空
35、题(每空 2 分,共 20 分)1、统计词有三种涵义,即_、_与_。2、加权算术平均数受两个因素的影响,一个是_,一个是_。3、在假设检验中,把符合 的总体判为不符合 加以拒绝,这类错误称为0H0H_错误;把不符合 的总体当作符合 而接受,这类错误称为_错误;显著性水平 是用来控制犯第_类错误的概率。4、直线相关系数等于零,说明两变量之间_;直线相关系数等于-1,说明两变量之间_。四、简答题(每题 5 分,共 20 分)1、统计学的确对我们的生活的各个方面起着重要的作用,但如果有意或者无意地误用统计专业资料WORD 完美格式 下载可编辑学方法,其结论则会带来更大的欺骗性。为了避免这种情况的发生
36、,请根据你的了解,写出 1 个误用统计学方法的例子,并说明应该如何正确应用方法?2、随机抽样的含义与特点?3、什么是标准差系数?在什么场合下计算标准差系数?4、说明单因素方差分析中,总离差平方和、水平项离差平方和、误差项离差平方和的含义与三者的关系?五、计算题(每题 10 分,共 30 分)1、随机抽查某企业 100 名职工,其月工资资料如下表 月工资额(百元) 职工数(人)588101012121414184108033合计 100要求:根据表中资料计算职工月工资的平均数、标准差和离散系数。2、某快餐店对顾客的平均花费进行抽样调查,随机抽取了 49 名顾客构成一个简单随机样本,调查结果为:样
37、本平均花费为 12.6 元,标准差为 2.8 元。试以 95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(2)=0.9545)3、从某一行业中随机抽取 5 家企业,所得产品产量与生产费用的数据如下:产品产量(台)x i 40 50 50 70 80生产费用(万元)yi130 140 145 150 156要求:利用最小二乘法求出估计的回归方程。附: 58x2.14y179052ix1043652iy423051ii专业资料WORD 完美格式 下载可编辑题库一答案一、选择题(每题 2 分,共 20 分)1. B 2.C 3.D 4.D 5.A 6.D 7A 8.B 9.D 1
38、0.C 二、多项选择题(每题 2 分,共 10 分)1.ABCE 2.ACE 3.ADE 4.AB 5.ADE 三、填空题(每空 2 分,共 20 分)1. 分组标志、组矩2. 4 元、0.013. 参数估计、假设检验4. 弃真错误、纳伪错误5. -1,1四、简答题(每题 5 分,共 20 分)1.答:(1)众数是一组数据分布的峰值,是一种位置代表值。其优点是不受极端值影响。其缺点是具有不唯一性。 (1 分)(2)中位数是一组数据中间位置上的代表值,也是位置代表值,其特点是不受数据极端值的影响。 (1 分)(3)均值是就全部数据计算的,它具有优良的数学性质,是实际中应用最广泛的集中趋势测度值。
39、其主要缺点是易受数据极端值的影响。 (1 分)应用场合:当数据呈对称分布或接近对称分布时,三个代表值相等或接近相等,这时应选择均值作为集中趋势的代表值;当数据为偏态分布,特别是当偏斜的程度较大时,应选择众数或中位数等位置代表值,这时它们的代表性要比均值好。此外,均值只适用于定距或定比尺度的数据,而对于定类和定比尺度的数据则无法计算均值,但却可以计算众数和中位数。 (2 分)2.答:拒绝原假设的最小的显著性水平,被称为观察到的显著性水平(2 分) 。(3 分) 。00H =1.645,所以应拒绝 而接受 H1,即北京市家庭每天上网的时间确有显著提高。 (5 分)3.解: (4 分)A222210
40、3().5nXY(4 分)A122/ 0X样本回归方程: (2 分)AY题库二答案一、选择题(每题 2 分,共 20 分)1. C 2.D 3.D 4.A 5.D 6.B 7B 8.B 9.B 10.A 二、多项选择题(每题 2 分,共 10 分)1.ABCD 2.ABD 3.ADE 4.AB 5.ADE 三、填空题(每空 2 分,共 20 分)1. 统计设计、统计调查、统计整理、统计分析2. 右偏、左偏3. 无偏性、有效性、一致性4. 线性相关四、简答题(每题 5 分,共 20 分)1. 答:离中趋势的常用指标包括:全距、平均差、标准差与标准差系数(2 分) 。 (1)全距:计算简单、但容易
41、受极端数值的影响,不能全面反映所有标志值的差异及分布状况,准确度差(2 分) 。 (2)平均差:不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;缺点:用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于向上累计 向下累计考分 人数 比率 人数(人) 比率(%) 人数(人) 比率(%)60 以下 2 5.0 2 5.0 40 100.060-70 7 17.5 9 22.5 38 95.070-80 11 27.5 20 50.0 31 77.580-90 12 30.0 32 80.0 20 50.090 以上 8 20.0 40 100.0 8 20.0合计 40 1
42、00.0 专业资料WORD 完美格式 下载可编辑作数学处理和参与统计分析运算(2 分) 。 (3)标准差:不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统计分析运算(2 分) 。 (4)离散系数:用来对比不同水平的同类现象,特别是不同类现象总体平均数代表性的大小(2 分) 。2.答:总体各单位的差异程度(即标准差的大小) ,总体各单位的差异程度越大,抽样误差越大(4 分) ;样本单位数的多少,样本单位数越大,抽样误差越小(2 分) ;抽样方法:不重复抽样的抽样误差比重复抽样的抽样误差小(2 分) ;抽样
43、组织方式:简单随机抽样的误差最大(2 分) 。3.答:相关分析,就是用一个指标来表明现象相互依存关系的密切程度。回归分析,就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系(2 分) 。(1)两者有密切的联系。它们不仅有共同的研究对象,而且在具体应用时,必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度(4 分) 。(2)相关分析与回归分析在研究目的和方法上是有明显区别的。相关分析研究变量之间相关的方向和相关的程度。但是相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况。回归分析则是研究变量之间相互关系的具体形式,确定一个相关的数学方程式,根据这个数学方程