1、(统计学+48 学时-(A)卷)共 7 页/第 1 页广州大学 2013-2014 学年第 1 学期统计学 A 卷答案一、 单项选择(每题 1 分,共 15 分)1. 指出下面的变量中哪一个属于分类变量( C )A. 寿命 B. 工资 C. 性别 D. 灯泡产量2. 某研究机构准备在全市 200 万个家庭中抽取 2000 个家庭,以推断该城市所有职工家庭的年人均收入。这项研究的样本是( A )A.2000 个家庭 B.200 万个家庭C.2000 个家庭的人均支出 D.200 万个家庭的人均支出3. 下列抽样方式中, 属于概率抽样的是( A )A.简单随机抽样 B.方便抽样 C.判断抽样 D.
2、滚雪球抽样4. 为描述身高和体重之间是否有某种关系,适合采用的图形是( C )A.条形图 B.对比条形图 C.散点图 D.箱线图5. 下列各项中,属于离散趋势度量的是(C )A.众数 B.中位数 C.方差 D.平均数6. 设 Z 服从标准正态分布,则 =(C)P( -0.48Z)A.0.3849 B.0.4319 C.0.1844 D.0.41477. 假设总体的方差为 0.25,从此总体中抽取样本量为 100 的样本,则样本均值的标准差约为(A)A.0.05 B.0.01 C.0.02 D.0.038. 在置信水平不变的条件下,要缩小置信区间,则(A)A.需要增加样本量 B.需要减少样本量C
3、.需要保持样本量不变 D.需要改变统计量的抽样标准差9. 如果事件 A 与 B 是独立的,则( C ) 。A. AB= B. P(B|A)=P(BA)C. P(AB) =P(A) P(B) D. P(A)=1-P(B)(统计学+48 学时-(A)卷)共 7 页/第 2 页10. 与标准正态分布相比,t 分布的特点是( C ) 。A. 对称分布 B. 非对称分布C. 比正态分布平坦和分散 D. 比正态分布集中11. 一组数的偏度为 0.5,则这组数的分布是( B )A. 左偏 B. 右偏 C. 对称 D. 不确定12. 已知一批产品的次品率为 5%,从中有放回地抽取 2 个。则 2 个产品中没有
4、次品的概率为(D) 。A. 0.05 B. 0.95 C. 0.05*0.05 D. 0.95*0.9513. 区间估计对比点估计的主要优点是( C ) 。A. 指明了估计的置信度 B. 有更高的无偏性C. 能提供误差的信息 D. 能直接给出总体参数的估计值14. 根据最小二乘法拟合直线回归方程是使( A ) 。A. 最 小2ii)(y B. 最 小)(iiyC. 最 小i D. 最 小i15指出下列指数中的拉氏数量指数公式(D ) 。A B C D 二、判断(每题 1 分,共 10 分)1.一组数的众数一定比均值大。 ()2.条形图中的矩形长和宽都有含义。 ()3.比较两组数的离散程度的大小
5、应该用离散系数而不是方差。 ()4.若事件 A 与事件 B 独立,则 P(A+B)=P (A)+P (B ) 。 ()5.在假设检验中,原假设和备择假设只有一个成立而且必有一个不成立。(统计学+48 学时-(A)卷)共 7 页/第 3 页()6.若随即变量 X 服从标准正态分布,则 )1(2XZ。 ()7.在方差分析中,方差是指样本数据的方差。 ()8.变量 x 和 y 的相关系数为 0,意味着 x 与 y 两者之间没有任何关系。 ()9.在平均指标变动因素分析中,结构变动影响指数构成指数是专门用以反映总体构成变化影响的指数。 ()10.对直线趋势 y1009x,若 x 每增加一个单位,则 y
6、 平均增加 9 个单位。()三、名词解释(每题 5 分,共 20 分)1统计学的内涵统计学是对数据进行搜集,整理,分析、研究并进行解释的一门科学。2离散型随机变量离散型随机变量是一类特殊的随机变量,其取值范围是有限个或者是可以一一排列的。3、第 I 类错误( 错误、弃真错误)原假设为真,拒绝原假设4、 中心极限定理从均值为 方差为 的总体中,抽取容量为 n 的随机样本,当 n 充分大时2(通常要求 n 30) ,样本均值 的抽样分布近似地服从均值为 方差为x的正态分布。 ( 表达相同的意思就算正确,或者等价的可用如下公式表/2示也算正确 )或者 dtexnPn 221/lim )1,0()(N
7、xnD(统计学+48 学时-(A)卷)共 7 页/第 4 页四、综合题(15 分)1.为了研究某电器卖场电脑的日销售量情况, 调查者对该电器卖场做了 6 天的调查,记录每天电脑销售的台数如下:65 70 70 79 81 87。a)研究中所考虑的总体是什么?(1 分)某电器卖场电脑日销售量b)题中所给的数据是总体数据还是样本数据? (1 分)_样本数据_,数据类型是_C_(A、分类数据,B、顺序数据 C、数值型数据) (1 分)c)所关心的随机变量是什么? (1 分)_(电脑)销售量 _d)变量是连续的还是离散的?(1 分)_离散_e)计算数据的中位数,众数,平均数(3 分)中位数=(70+7
8、9)/2=74.5, 众数为 70,平均数=(65 +70 +70 +79+81+87)/6=75.33f)计算数据的平均绝对离差(2 分)|65-75.33|+|70-75.33|+ |70-75.33|+|79-75.33|+|81-75.33|+| 87-75.33|/6=7g)计算数据的方差和标准差(2 分)方差=69.0667标准差 8.31h)计算每个数据对应的标准分数(3)-1.2434 -0.6417 -0.6417 0.4412 0.6819 1.4038五、计算题(共 40 分。需写出计算过程,仅写出最终结果不得分)1已知事件 A 和 B 发生的概率为 P(A)=0.3,P
9、(B)=0.2。若事件 A 和 B 至少有一个发生的概率是 0.35。求 P(AB)(4 分) ,P(A|B)(3 分), P(B|A)(3 分) 。P(AB)=P(A)+P(B)-P(AB)=0.3+0.2-0.35=0.15P(A|B)=P(AB)/P(B)=0.15/0.2=0.75;(统计学+48 学时-(A)卷)共 7 页/第 5 页P(B|A)=P(AB)/P(A)=0.15/0.3=0.52根据长期实验,飞机的最大飞行速度服从正态分布。现在对某型号飞机进行了 36 次试飞,得每次最大飞行速度的平均速度为 420 米每秒,样本标准差为 5 米每秒,试以 90%和 95%的置信水平建
10、立该型号飞机最大速度的数学期望的置信区间。 (注 96.1,64.025.05. zz) 。 (10 分) 。已知:n=36, 。4.,05zsx网络用户每天平均上网时间的 95%的置信区间为:(3 分)63.12396.14202/ nszx即为(418.36, 421.633) 。 (2分)网络用户每天平均上网时间的 90%的置信区间为:(3 分)36.142056.14202/ nszx即为(418.633, 421.366) 。 (2分)3. 某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布。每包标准重量为 1000 克。某日随机抽查 9 包,测得样本平均重量为 986 克,
11、标准差为 24 克。试问在 a0 05 的显著性水平上,能否认为这天自动包装机正常工作?(10 分)解:(1)建立假设:H0:1000;H1:1000 (1 分)(2)选择检验统计量:根据题意可知,总体方差未知,同时 n=930,因此是(统计学+48 学时-(A)卷)共 7 页/第 6 页小样本。选择 t 检验统计量。 (3 分)0xtsn(3)计算 0.05 的 t 统计量临界值。当 0.05 ,自由度 n18 时,查表得 6.2)8(/at。 (2 分)(4)计算选择的 t 检验统计量值: 0xtsn(986-1000)/24*3=-1.75(2 分)(5)推断结果:由于|-1.75|2.
12、306,落在接受区域,故不能拒绝原假设,说明在 5%的显著性水平下,打包机工作正常。 (2 分)4. 一家物流公司的管理人员想研究货物的运输距离和运输时间的关系,为此,他抽出了公司最近 10 个卡车运货记录的随机样本,得到运送距离(单位:km)和运送时间(单位:天) 的数据如下:运 送 距 离 x 825 215 1070 550 480 920 1350 325 670 1215运 送 时 间 y 3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0要求:(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态(注意画图比例, 点的位置相对合理即可)(2)计算线性相关系数,说明两个变量之间的关系强度。解:(1)(统计学+48 学时-(A)卷)共 7 页/第 7 页x运 送 距 离 ( km) 12501075502y运送时间(天) 54321 _可能存在线性关系。 (4 分)(2)依据如下公式计算=4653/ sqrt(1297860)/ sqrt(18.5)=0.9496.由于相关系数值很大,因此可以认为两者有很强的线性关系。 (6 分)