1、1统计学导论(第二版)习题详解第一章一、判断题一、 判断题1统计学是数学的一个分支。答:错。统计学和数学都是研究数量关系的,两者虽然关系非常密切,但两个学科有不同的性质特点。数学撇开具体的对象,以最一般的形式研究数量的联系和空间形式;而统计学的数据则总是与客观的对象联系在一起。特别是统计学中的应用统计学与各不同领域的实质性学科有着非常密切的联系,是有具体对象的方法论。 。从研究方法看,数学的研究方法主要是逻辑推理和演绎论证的方法,而统计的方法,本质上是归纳的方法。统计学家特别是应用统计学家则需要深入实际,进行调查或实验去取得数据,研究时不仅要运用统计的方法,而且还要掌握某一专门领域的知识,才能
2、得到有意义的成果。从成果评价标准看,数学注意方法推导的严谨性和正确性。统计学则更加注意方法的适用性和可操作性。2统计学是一门独立的社会科学。答:错。统计学是跨社会科学领域和自然科学领域的多学科性的科学。3 统计学是一门实质性科学。答:错。实质性的科学研究该领域现象的本质关系和变化规律;而统计学则是为研究认识这些关系和规律提供数量分析的方法。4统计学是一门方法论科学。答:对。统计学是有关如何测定、收集和分析反映客观现象总体数量的数据,以帮助人们正确认识客观世界数量规律的方法论科学。5描述统计是用文字和图表对客观世界进行描述。答:错。描述统计是对采集的数据进行登记、审核、整理、归类,在此基础上进一
3、步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用信息。描述统计不仅仅使用文字和图表来描述,更重要的是要利用有关统计指标反映客观事物的数量特征。6对于有限总体不必应用推断统计方法。答:错。一些有限总体,由于各种原因,并不一定都能采用全面调查的方法。例如,某一批电视机是有限总体,要检验其显像管的寿命。不可能每一台都去进行观察和实验,只能应用抽样调查方法。7经济社会统计问题都属于有限总体的问题。答:错。不少社会经济的统计问题属于无限总体。例如要研究消费者的消费倾向,消费者不仅包括现在的消费者而且还包括未来的消费者,因而实际上是一个无限总体。8 理论统计学与应用
4、统计学是两类性质不同的统计学。答:对。理论统计具有通用方法论的性质,而应用统计学则与各不同领域的实质性学科有着非常密切2的联系,具有复合型学科和边缘学科的性质。二、单项选择题1.社会经济统计学的研究对象是( A ) 。A.社会经济现象的数量方面 B.统计工作C.社会经济的内在规律 D.统计方法2.考察全国的工业企业的情况时,以下标志中属于不变标志的有( A ) 。A.产业分类 B.职工人数 C.劳动生产率 D.所有制3.要考察全国居民的人均住房面积,其统计总体是(A ) 。A.全国所有居民户 B.全国的住宅 C.各省市自治区 D.某一居民户4.最早使用统计学这一学术用语的是( B) 。A.政治
5、算术学派 B.国势学派 C.社会统计学派 D.数理统计学派三、分析问答题1试分析以下几种统计数据所采用的计量尺度属于何种计量尺度:人口、民族、信教人数、进出口总额、经济增长率。答:定类尺度的数学特征是“= ”或“ ”,所以只可用来分类,民族就是定类尺度数据,它可以区分为汉、藏、回等民族。定序尺度的数学特征是“”或“60) ,都属于我们所关心的情况的对立情况,都需要拒绝原假设。因而要把拒绝域同时放在左、右两个尾部,即,进行双尾检验。若想了解学生的语文理解程度是否达到或超过 60 分(教材中原来只写“是否达到” ,在理解上容易产生歧义,应加上“或超过” )其中的等于 60 等价于真实情况为第一种情
6、况,其中的大于 6060:0H等价于真实情况为第二种情况等价于真实情况为第二种情况:1上述一组假设对应着左单尾检验。用左单尾检验的理由是:我们所关心的是, 是否大于或等于 60(将 60 设为原假设) 。若检验统计量的样本值落在检验统计量的概率分布曲线的左尾部(这意味着 60)时,这属于我们所关心的情况,不需要拒绝原假设。因而只把拒绝域放在左尾部,即,进行左单尾检验。(4)构造检验统计量在原假设成立 的条件下,有下列检验统计量服从自由度为 1=4001 的 分布。由60:0Hnt于自由度相当大,故这个分布同标准正态分布非常接近。 )140(6tnsyt(5)计算检验统计量的样本值=400 =6
7、1.6 =14.4s2.40.16nsyt(6)观察到的显著水平(P-值)查标准正态分布表,z=2.22 时阴影面积值为 0.4868。故右尾 P-值= P(2.22z )=0.5+0.4868=0.9868(7)用 P-值检验规则做检验学生的语文理解程度是否为60 分( : =60 ; : 60)双尾检验0H118)若规定 =0.05检验用的显著水平标准为 / 2=0.05 / 2=0.025由于右尾 P-值=0.01320.025,故不能拒绝原假设。学生的语文理解程度是否达到或超过 60分( : 60 ; : 0.05,故不能拒绝原假设。)若规定 =0.01检验用的显著水平标准为 =0.0
8、1 由于左尾 P-值=0.98680.01,故不能拒绝原假设。(8)用临界值值检验规则做检验学生的语文理解程度是否为60 分( : =60 ; : 60)双尾检验0H1)若规定 =0.05查标准正态分布表,z / 2= z0.05 / 2 = z0.025 =1.96,故,拒绝域为 和 ,接受96.1,.域为 。96.1,由于 z=2.221.96,检验统计量的样本值落在拒绝域,故拒绝原假设。)若规定 =0.01查标准正态分布表,z / 2= z0.01 / 2 = z0.005 =2.575,故,拒绝域为 和 ,接57.2,5.受域为 。57.2,.由于 z=2.221.645,检验统计量的
9、样本值落在接受域,故不能拒绝原假设。)若规定 =0.01查标准正态分布表,在左尾部有 z = z0.01 =2.325,故,拒绝域为 ,接受域为325.,。,325.由于 z=2.222.325,检验统计量的样本值落在接受域,故不能拒绝原假设。(9)检验结论学生的语文理解程度是否为60 分19)若规定 =0.05样本数据显著地表明,学生的语文理解程度并非恰好为 60 分。上述结论的双尾显著水平为0.05。)若规定 =0.01样本数据提供的证据不足以推翻学生的语文理解程度恰好为 60 分的假设,也就是说,学生的语文理解程度有可能恰好为 60 分。上述结论的双尾显著水平为0.01。学生的语文理解程
10、度是否达到或超过 60分)若规定 =0.05样本数据提供的证据几乎完全没有理由推翻学生的语文理解程度达到或超过 60 分的假设,也就是说,可以认为学生的语文理解程度达到或超过了 60 分。上述结论的单尾显著水平为0.05。)若规定 =0.01样本数据提供的证据几乎完全没有理由推翻学生的语文理解程度达到或超过 60 分的假设,也就是说,可以认为学生的语文理解程度达到或超过了 60 分。上述结论的单尾显著水平为0.01。2. 是否 1?(这里的是犯弃 真错误的概率, 是犯取伪错误的概率)请说明为什么是或为什么不是?答:是在成立的总 体中检验统计量分布的概率密度曲线属于拒绝域的尾部(一个或两个)面积
11、;0H是不成立的另 外某个总体中与前述检验统计量相对应的另外一个统计量分布的概率密度曲线伸入接受域的尾部面积。由于和二者分 别属于两个概率密度曲线,因此不会存在二者之和等于1 的必然规律。人们熟知的必然关系是:在成立的总体 的检验统计量分布的概率密度曲线下,有 +(1 )0H=1。这里, 和( 1 )是上述同一概率密度曲线下分别属于拒绝 域和接受域的两个部分的面积。(说明:拒绝域和接受域是实数轴的两个部分,而不是概率密度曲线下的这一部分面积或那一部分面积)3. 据一个汽车制造厂家称,某种新型小汽车耗用每加仑汽油至少能行驶 25 公里,一个消费者研究小组对此感兴趣并进行检验。检验时的前提条件是已
12、知生产此种小汽车的单位燃料行驶里程技术性能指标服从正态分布,总体方差为 4。试回答下列问题:(1)对于由 16 辆小汽车所组成的一个简单随机样本,取显著性水平为 0.01,则检验中根据 来确定x是否拒绝制造家的宣称时,其依据是什么(即,检验规则是什么)?(2)按上述检验规则,当样本均值为每加仑 23、24、25.5 公里时,犯第一类错误的概率是多少?答:(1)拒绝域 ;(2)样本均值为 23,24,25.5 时,犯第一类错误的概率都是 0.01。3.,(20三、计算题1.一台自动机床加工零件的直径服从正态分 布,加工要求为 E(X)=5cm。现从一天的产品中抽取 50X个,分别测量直径后算得
13、,标准差 0.6cm。试在显著性水平 0.05 的要求下检验这天的产品直径cmx8.4平均值是否处在控制状态(用临界值规则)?解:(1)提出假设 5:0H1(2)构造检验统计量并计算样本观测值在成立条件下 ::0357.26.842nsxZ(3)确定临界值和拒绝域 9105.拒绝域为 ,96.1.,(4)做出检验决策 .37.2025.Z检验统计量的样本观测值落在拒绝域。拒绝原假设 ,接受 假设,认为生产控制水平不正常。0H12.已知初婚年龄服从正态分布。根据 9 个人的调查结果,样本均值 岁,样本标准差(以 9-15.23x作为分母计算) 岁。问是否可以认为该地区初婚年龄数学期望 值已经超过
14、 20 岁( ,用3s 5.临界值规则)?解:(1)提出假设 0:2H1(2)构造检验统计量并计算样本观测值在成立条件下 0:223.5.9xtsn(3)确定临界值和拒绝域0.5(8)1.6t拒绝域为 ,(4)做出检验决策 检验统计量的样本观测值落入拒绝域3.t21拒绝 ,接受 ,即可以认为该地区初婚年龄数学期望值已经超过 20 岁。0H13.从某县小学六年级男学生中用简单随机抽样方式抽取 400 名,测量他们的体重,算得平均值为61.6公斤,标准差是 14.4 公斤。如果不知六年级男生体重随机变量服从何种分布,可否用上述样本均值猜测该随机变量的数学期望值为 60 公斤?按显著性水平0.05
15、和 0.01 分别进行检验(用临界值规则) 。解: 时5.(1)提出假设 60:0H1(2)构造检验统计量并计算样本观测值在成立条件下 ::02.4.162nsxZ(3)确定临界值和拒绝域 9.025.拒绝域为 ,96,(4)做出检验决策 .1.025.Z检验统计量的样本观测值落在拒绝域。拒绝原假设 ,接受 ,认为该县六年级男生体重的数学期望不等于 60 公斤。0H1时.(1)提出假设 6:01(2)构造检验统计量并计算样本观测值在成立条件下 :0:0H2.4.162nsxZ(3)确定临界值和拒绝域 57.0.拒绝域为 ,57,(4)做出检验决策 .2.205.Z检验统计量的样本观测值落在接受
16、域。不能拒绝 ,即没有显著证据表明该县六年级男生体重的数学期望不等于 60 公斤。0H224.某公司负责人发现开出去的发票有大量笔误,而且断定这些发票中,有笔误的发票占 20%以上。随机抽取 400 张发票,检查后发现其中有笔误的占18%,这是否可以证明负责人的判断正确?( ,用临界值规则) 5.解:(1)提出假设 0:2%H1(2)构造检验统计量并计算样本观测值在成立条件下 :018201()4pZn(3)确定临界值和拒绝域0.564拒绝域为 1.,)(4)做出检验决策 检验统计量的样本观测值落在接受域.Z接受 ,即不能证明负责人的判断正确。0H5. 从某地区劳动者有限总体中用简单随机放回的
17、方式抽取一个 4900人的样本,其中具有大学毕业文化程度的为 600 人。我们猜测,在该地区劳动者随机试验中任意一人具有大学毕业文化程度的概率是11%。要求检验上述猜测( =0.05,用临界值规则) 。解:(1)提出假设%1:0H(2)构造检验统计量并计算样本观测值在成立条件下 ::0样本比例 2.149668.9npZ(3)确定临界值和拒绝域 6.025.拒绝域为 ,.1.,(4)做出检验决策 96.8.025.Z检验统计量的样本观测值落在拒绝域。23拒绝原假设 ,接受 假设,即能够推翻所作的猜测。0H16.从某市已办理购房贷款的全体居民中用简单随机不放回方式抽取了 342 户,其中,月收入
18、 5000 元以下的有137 户,户均借款额 7.4635 万元,各户借款额之间的方差 24.999;月收入 5000 元及以上的有205 户,户借款额 8.9756 万元,各户借款额之间的方差 28.541。可见,在申请贷款的居民中,收入较高者,申请数额也较大。试问,收入水平不同的居民之间申请贷款水平的这种差别是一种必然规律,还是纯属偶然?( ,用 P-值规则和临界值规则)05.解:; ;2;137n9756.8Y;463.7X541.28S;9.421(1) 和 0H,21:21:检验统计量: ,/2121nFS由于 24.999/28.541=0.8758978 落在 95%置信区间(0
19、.7314319,1.354116)之内。 不能拒绝零假设。 (2)假设两个总体方差未知,但相等。; 210:H21:在 下,有2121ntnSYXw其中 2S4.704365.89.63102217.5单边 p-值: 小于 0.05, 即落在单边拒绝域 8.,.pt之内。拒绝 (不属偶然) 。 98,0H7.用不放回简单随机抽样方法分别从甲、乙二地各抽取200 名六年级学生进行数学测试,平均成绩分别为 62 分、67 分,标准差分别为25 分、20 分,试以 0.05 的显著水平检验两地六年级数学教学水平是否显著地有差异。解:(1)提出假设 210:H(2)构造检验统计量并计算样本观测值在成
20、立条件下 :024209.20567nsy12Z(3)确定临界值和拒绝域 96.05.拒绝域为 ,6.1.,(4)做出检验决策 9.2.025.Z检验统计量的样本观测值落在拒绝域。拒绝原假设 ,接受 ,即两地的教育水平有差异。0H18.从成年居民有限总体中简单随机不放回地抽取 228 人,经调查登记知其中男性 100 人,女性 128人。就企业的促销活动(如折扣销售,抽奖销售,买几赠几,等等)是否会激发本人购买欲望这一问题请他(她)们发表意见。男性中有 40%的人、女性中有 43%的人回答说促销活动对自己影响不大或没有影响。试问,促销活动对不同性别的人购买欲望的影响是否有差别?( ,用临界值规
21、则)10.解:男女无差别0H:男女有差别1 128,43.0,4.21npnp两个比例的差的 -显著水平标准,所以不能拒绝 ,即没有得到足以表明性别对成绩有影响的显著证据。05.0(二)(1)提出假设: 43210:H28不全相等4321:、H(2)计算离差平方和4m1n52123n450n=5492 =6730 =5070 =4555 =21847y yyy=2763280 =3098100 =2237900 =1840125 =993940521 2 3 24 2组间变差 SSR= -nm1ii2n=11* +15* +12* +12* -50*549)( 21567)( 2)( 21)(
22、 25087)(=9632609.568-9545828.18=86781.388组内变差 SSE= - =9939405-9632609.568=306795.432m1inj2ijiy1i2(3)构造检验统计量并计算样本观测值F= = =4.3372)/(SER)450/(3.067918(4)确定临界值和拒绝域F0.05(3,46)=2.816拒绝域为: ,81.2(5)做出检验决策临界值规则:F=4.3372 F 0.05(3,46)=2.816检验统计量的样本观测值落在拒绝域。拒绝原假设 ,接受 ,即父母文化程度对孩子的学习成绩有影响。0H1P-值规则:根据算得的检验统计量的样本值(
23、 F 值)算出 P-值=0.008973。由于 P-值=0.008973 =6.93,检验统计量的样本,93.6 9.68AF)12,(0.值落在拒绝域,所以拒绝原假设。就是说,样本证据显著地表明,在热处理时所采用的三种不同的温度方案下,所发生的金属材料强度是不相同的。上述结论的单尾显著水平为0.01。时间对材料强度的影响:从方差分析表可得, , =5.95。127.0BF)12,3(.F拒绝域为 ,接受域为(0,5.95) 。由于 =5.95,检验统计量的,95. 7.0B)12,3(.F样本值落在拒绝域,所以拒绝原假设。就是说,样本证据显著地表明,在热处理时所采用的四种不同的时间方案下,所
24、发生的金属材料强度是不相同的。上述结论的单尾显著水平为0.01。温度、时间两个因素的交互作用对材料强度的影响:从方差分析表可得, , =4.82。27.8ABF)12,6(0.F拒绝域为 ,接受域为(0,4.82) 。由于 =4.82,检验统计量的,82.4 7.8AB)12,6(0.F样本值落在拒绝域,所以拒绝原假设。就是说,样本证据显著地表明,在热处理时所采用的三种不同的温度方案与四种不同的时间方案之间,对金属材料强度的影响存在着交互作用。上述结论的单尾显著水平为0.01。上述检验基于临界值规则。若使用 P 值规则,上述三个检验统计量对应的P 值(方差分析表中的 P-Value 列) ,均接近于 0,远小于 0.01,均拒绝原假设。第七章一、不定项选择题1变量之间的关系按相关程度分可分为( B、C、D ) 。A.正相关; B. 不相关; C. 完全相关; D. 不完全相关2复相关系数的取值区间为( A ) 。A. ; B. ;0R1RC. ; D. 1