收藏 分享(赏)

统计学课后答案.docx

上传人:weiwoduzun 文档编号:3704511 上传时间:2018-11-16 格式:DOCX 页数:24 大小:640.93KB
下载 相关 举报
统计学课后答案.docx_第1页
第1页 / 共24页
统计学课后答案.docx_第2页
第2页 / 共24页
统计学课后答案.docx_第3页
第3页 / 共24页
统计学课后答案.docx_第4页
第4页 / 共24页
统计学课后答案.docx_第5页
第5页 / 共24页
点击查看更多>>
资源描述

1、第一章1 举出你所知道的统计应用的例子。答:期末考试后统计班里同学的成绩,从而进行排名等;人口普查统计,从而得知男女人口比例,年龄分布等;统计一个生态系统里某种物种的密度;统计股票市场上某一天的各种数据;统计某个城市的人均收入水平,人民幸福指数,对某一电视节目的看法等。2. 解释定性数据和定量数据的区别,分别给出一个定性数据和一个定量数据的例子。答:定性数据和定量数据的区别:定性数据是由于我们考虑的是取值为类别的变量,对这些类别用数字来分别代表就得到定性数据;定量数据是我们所考虑的变量的取值为数值,它将在某个区间上连续取值,或在某个区间上取离散的值。定性数据的例子:例如考察某幼儿园 10 个人

2、的性别,定义 1=男,2=女,则所得到定性数据为:1,1,2,2,2,1,2,1,1,1.定量数据的例子:考察某幼儿园 10 个人的身高,则此变量取值区间为(0,200) (单位:cm)3. 解释样本和总体的区别。答:总体是根据一定目的和要求所确定的研究事物的全体。为了了解总体的分布,我们从总体中随机地抽取一些个体,称这些个体的全体为样本。样本和总体的区别在于总体是要考虑对象的全体,而样本是从总体中抽取出的一部分具有代表性的个体,从而通过对样本的研究得出关于总体的一些结论。4. 解释离散型变量和连续型变量的区别,并各举一例。离散型变量是指其数值只能用自然数或整数单位计算。例如:某企业里职工的人

3、数连续型变量是如果所考虑变量可以在某个区间内取任一实数,即变量的取值可以是连续的。例如:生产零件的规格尺寸。5.阐述四种主要的收集数据方法的区别。答:观测,访问,问卷,实验区别:观测数据的研究者尽量不干涉研究对象的行为模式;访问在一定程度上对被访问者心理造成干扰,则收集到的数据会有误差;问卷常会产生未响应误差;实验时需要其控制它变量的影响。6.举出一些观测数据和实验数据的例子。答:(1)观测数据:证券分析人员可能会记录某即将收购的公司在被收购的前一天的股市收盘价,并与宣布被收购的当天的收盘价比较。(2)试验数据:研究某药物是否具有特定效用,将所有志愿者分成治疗者和控制组。治疗组每天服用一片该药

4、物,而控制组则服用一片大小形状颜色与前一药物相同或相近的安慰剂。7.答:(1)是样本。所有的 CEO 的收入排行榜上的数据是总体,我们从中抽取的 500 名 CEO 的收入排行榜上的数据是样本。(2)其中 CEO 所在公司所属行业是定性变量,而上一年全年CEO 总收入(百万美元) ,过去 5 年中 CEO 的总收入,公司所持有的股票份额(百万) ,CEO 的年龄(岁),CEO 的效率评分是定量变量。8. 答:定类水平:性别定序水平:人可以根据年龄分为幼年、少年、青年、中年、壮年、老年定距水平:温度定比水平:身高,收入9答:根据这个样本知:约有 80%的顾客认为此药膏非常好,约有 6.4%的顾客

5、认为此药膏一般,而约有 13.6%的顾客的反应不明朗。10. 第二章1.(1)两个班考试成绩的柱形图如下所示:(2)甲班和乙班考试成绩的饼图分别如下所示(2)两个班考试成绩分布的特点:成绩在优和良的等级上乙班人数要多于甲班,在中等级别甲班人数多于乙班,在及格和不及格级别上乙班人数少于甲班。很明显,乙班成绩要比甲班好。2.(1)反映评价等级的分布的条形图如下所示:(2)帕累托图如下:02468101214161820优 良 中 及 格 不 及 格人 数 甲 班人 数 乙 班人 数 乙 班优良中及 格不 及 格人 数 甲 班优良中及 格不 及 格0 20 40 60 80 100 120好很 差较

6、 差较 好一 般合 计频 数、10806040200、10%8060%4020%014151820313.(1)国产车和进口车销售量的对比条形图:(2)国产车销售量帕累托图进口车销售量帕累托图:、50403020100、10%8060%4020%0610617230368102494.答:首先认为是雇员盗窃以及高价买入导致存货缩水。帕累托图如下所示:. 、 、50403020100、 10%7550%250%290780147015605. 、50403020100、 10%8060%4020%046957379297281468由图可得,对汽车经销商的投诉是最多的。6、10806040200

7、、10%8060%4020%03451215617DBCAE、50403020100、 10%7550%250%7789108 数 目南 美北 美欧 洲非 洲大 洋 洲亚 洲910.11.12.预 算 额 ( 百 万 美 元 )科 学 , 航 空 , 探 索探 索 能 力常 规 检 查死 亡 人 数轿 车卡 车摩 托 车其 他死 亡 人 数轿 车卡 车摩 托 车其 他0200040006000800010000年 度 进 口 额 ( 万 元 )第三章1.答:频数分布表比较清晰的展现出在每个分组中的数据占样本数据的百分比。2.答:频数分布图便于对数据的主要特征(高点,低点,集中点等)得到直观的印

8、象。3.答:相对频率很容易可以看出每组的频数,而累积频率可以方便的看出该组数据之前的累积频率。4.(1)9 组;(2)10 组;(3)18 组;(4)15 组。5. 0 组。6. 组。7. (1)组距:10(2)数据趋向于集中到 58(3)数据呈左偏态尖峰分布。(4)相对频数分布为组 频数 相对频数1524 1 2.5%2534 2 5.0%3544 5 12.5%4554 10 25.0%5564 15 37.5%6574 4 10.0%7584 3 7.5%8. (1)答:5 名员工由于生病每年缺勤的天数少于 3 天。17 名员工由于生病每年缺勤的天数少于 6 天。(2)累积频数分布缺勤的

9、天数 累计频数 累积频率03 5 10%36 17 34%69 40 80%912 48 96%1215 50 100%(3)根据累积频数折线图,75%的员工每年由于生病而缺勤的天数不超过 37.5 天9.柱体图如下:10 答:线图如下:从下图可看出 19902007 年每年的人口呈递增的趋势,且在 1998 年以前增长速度较快,1998 年以后人口增长速度相比以前有所下降。0200040006000800010000年 度 进 口 额2076520432011987196541932190 、1301250120150 、11.答:(1)建议分成 6 组;组距为 2。(2)直方图如下所示:直

10、方图说明大多数人上网时间在 4 到 7个小时之间;也有一部分人上网时间在 1 到 3 个小时之间或者是 8 到 10 个小时之间。12.00.8.6.04.2.00. 、108642Mean =5.17StdDv2684N12. 答:茎叶图展示数据如下:年龄 Stem-and-Leaf PlotFrequency Stem & Leaf1.00 4 . 03.00 4 . 7994.00 5 . 01244.00 5 . 68993.00 6 . 1231.00 6 . 72.00 7 . 133.00 7 . 6893.00 8 . 0441.00 8 . 7Stem width: 10Ea

11、ch leaf: 1 case(s)13.答:茎叶图展示数据如下:冰层厚度(厘米) Stem-and-Leaf PlotFrequency Stem & Leaf2.00 4 . 395.00 5 . 188895.00 6 . 489996.00 7 . 0022252.00 8 . 01Stem width: 1.0Each leaf: 1 case(s)14答:用散点图表示数据如下:15.答:散点图如下:16.答:袋中苹果数量的均值为:21.71,中位数为:22.17.答:该机器每天被使用的次数的均值为 70.53。18.答:(1)售价的均值是:1.6380(2)售价的中位数是:1.45

12、00(3)售价的众数是:1.4919.答:地震等级的中位数是:7.050 地震等级的均值是:6.967死亡人数的中位数是:1100,死亡人数的均值是:5607.79地震等级选择均值作为集中趋势的度量;死亡人数选择中位数作为集中趋势的度量。20.答:(1)(2)数据显示不存在异常值。21.答:(1)样本均值是:4.154 万元;样本标准差是:0.5317(2)中位数:4.200;上四分位数:3.750;下四分位数:4.650(3)样本中每个员工获得 5%的加薪后集合的样本均值为:4.3615,样本标准差为:0.55827(4)月薪的样本均值为:0.3462,样本标准差为:0.04431(5)用不

13、同的度量来衡量数据的变异所得结果是不同的。22.答:(1)数据的均值是:49.23 数据的中位数是:46.50(2)茎叶图:(3)数据呈右偏态,扁平分布。23.答:(1)女生体重差异大,因为男生体重的变异系数比女生的小;(2)平均数(kg) 标准差(kg)男生 132 11女生 110 11(3) 68%(4) 95%24.答:此位应试者 A 项测试更为理想。25.答:国内乘客的变异系数为 CV1=4.5/21x100%=21.4%海外乘客的变异系数为 CV2=6.8/35X100%=19.4%根据两组乘客的行李重量的变异系数可以看出,国内乘客携带行李重量的相对离散程度更高,而海外乘客的相对离

14、散程度则比国内更低一些。26.答:(1)因为这是两组不同水平的变量,均值相差很远,使用变异系数可对离散性进行有意义的比较。(2)市盈率的变异系数为:0.165,投资收益率的变异系数为:0.208,这说明投资收益率的相对离散程度比市盈率的大。27.答:(1)使用标准差和方差来反映风险(2)商业类股票,因为商业类股票方差较小,离峰值较集中(3)选择高科技类股票,因为两类股票峰值左侧的频数都较少,而峰值及其右侧的频数较多,其中高科技类股票的收益率更高,选择它有更大几率获得更多利润。第四章1.答:(1) 16(2)利用等可能事件求概率的方法。(3)掷一枚骰子的结果中 1 点到 6 点的结果是相等的,互

15、斥的。2.答:(1) 150(2)使用相对频数的方法3.答:(1)古典概率(2)古典概率(3)主观概率4 答:(1)一共有 36 种可能结果,具体组合略。(2)利用古典概型求概率。5 答:(1) 13(2)6.答:(1)实验是对 40 个学生进行问卷调查。(2)40 个学生中有 23 个回答“是”是一个可能的事件。(3)0.25(4)不一定7.答:(1)实验是对驾驶员违章进行的调查。(2)有 1910 名驾驶员违章数为 0。(3)0.009(4)使用了相对频数的方法。8.答:概率是 0.159.答:不是,如果电池是另一辆车上的,则概率是 0.02,这是因为这两件事是相互独立的。.10.答:这是

16、公平的,抽签的次序并不影响公平性。证明如下:第一次抽到的概率:第二次抽到的概率:第三次抽到的概率:第四次抽到的概率:第五次抽到的概率:因此,任何一次抽中的概率都是 0.2.11.答:这从概率的方面讲是公平的,因为在未抽签之前每个人抽到的概率都是 0.2.12.答:(1)在 15 次实验中至少 3 次成功的概率是:0.18(2)在 10 次实验中最多 1 次成功的概率是:0.74(3)在 12 次实验中,成功次数至少 3 次最多 5 次的概率是:0.1113.答:恰有 3 个航班晚点的概率是 0.129,最多有 4 个航班晚的点概率是:0.9914.答:(1)0.724(2)0.171(3)0.

17、10515.答:(1)0.251(2)0.8(3)0.00816.答:蛋糕上葡萄干的平均粒数是:317答:该种汽车的耗油量近似服从正态分布。这是因为我们通过所给数据画出直方图如下,可看出所给数据近似服从正态分布。18. 答:思路:在 Excel 中改变 n 和 p 值,可以得到这四个二项分布图像,再与正态分布比较。(1) (2)(3) (4)19.答:学生成绩不及格的概率和处于 6580 之间的概率是 0.6520.答:40984 元。第五章1.答:51.32,58.682.答:38.91,41.093.答:(1)0.556(2)16.90,23.104.答: 075.Z =1.445.答:(

18、1)总体均值的点估计是 20 元。这是因为样本均值是总体均值的无偏估计。(2)18.60,21.406.答:(1)18.78,21.22(2)这是因为样本量增大了。7.答:(1)总体均值的点估计是:80.60(2)79.84,81.36(3)(2)的结果的意义是:在 100 次抽取 60 笔交易时会有99 次总体均值落在(2)的区间内。8答:全体学生中,每篇文章平均拼写错误的单词数目的 95%置信区间是:59.29,60.81 9.答:(1)总体均值是 20.样本均值是总体均值的最佳估计。(2)这是因为总体的方差未知,总体分布形态未知,且样本量少于 30.需要的假定是:1,观测是独立的;2 因

19、变量总体服从正态分布。(3)t(19) 分布的上侧 0.025 分位数是:0.032(4)总体均值的 95%置信区间是:19.99,20.01(5)认为总体均值是 21 只是不合理的,认为是 25 只也是不合理的。10.答:总体均值的 98%置信区间是29.99,38.14解释:在 100 次抽取 15 个人的样本中总体均值有 98 次会在区间29.99,38.14中。11.答:(1)总体比例是:0.8(2)样本比例的标准误是:0.04(3)总体比例的 95%的置信区间是0.7216,0.8784(4)在 100 次抽取 100 个样本容量的样本时,有 95 次总体比例取值在(3)所示的区间内

20、。12答:总体比例置信水平为 90%的置信区间是: 0.18,0.28总体比例置信水平为 95%的置信区间是: 0.17,0.2913.答:(1)90%的置信区间为:-19.51,29.51(2)95%的置信区间为:-24.20,34.20(3)99%的置信区间为:-33.38,43.3814.答:(1)95%的置信区间为:1.29,2.71(2)95%的置信区间为:1.86,2.14(3)95%的置信区间为:-5.06,9.06(4)95%的置信区间为:1.86,2.12(5)95%的置信区间为:-3.10,7.1015.答:需要的样本量是:9716.答:需要的样本量是:6017.答:需要的样本量是:9618.答:需要的样本量是:16519.答:应该调查 38 位观众20.答:应该抽取 10 个顾客作为样本。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高等教育 > 统计学

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报