1、第十章 算法、统计与概率第 3 课时 统计初步(2) (对 应 学 生 用 书 (文 )150 152页(理 )156 158页 )考情分析 考点新知用样本的频率分布、特征数来估计总体的分布,在高考中常以填空题的形式出现,以实际问题为背景,综合考查学生对基础知识的掌握程度以及一定的读图能力热点问题是频率分布直方图和用样本的数字特征估计总体的数字特征 了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点. 理解样本平均数的意义和作用,会计算样本平均数、方差和标准差. 会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样
2、本估计总体的思想. 会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.1. (必修 3P55 练习 2 改编)一个容量为 20 的样本数据,分组后,组别与频数如下:组别 10,20) 20,30) 30,40) 40,50) 50,60) 60,70频数 2 3 4 5 4 2则样本在(20,50上的频率为_答案:0.6解析:本题考查样本的频率运算据表知样本分布在(20,50 的频数 34512,故其频率为 0.6.12202. (必修 3P61 练习 2 改编)某篮球运动员在 7 天中进行投篮训练的时间(单位:min)用茎叶图表示( 如图),图中左列表示训练时间的十位数,右
3、列表示训练时间的个位数,则该运动员这 7 天的平均训练时间为_min.6 4 5 77 2 58 0 1答案:72解析:由茎叶图知平均训练时间为 (64656772758081) 72.x 173. (必修 3P68 练习 4 改编)下表是一个容量为 20 的样本数据分组后的频数分布,若利用组中值计算本组数据的平均值 ,则 _a a 数据 10.5,13.5) 13.5,16.5) 16.5,19.5) 19.5,22.5)频数 4 6 6 4答案:16.5解析: (124156 186214) 330 16.5.a 120 1204. (必修 3P71 练习 1 改编) 某射击选手连续射击
4、5 枪命中的环数分别为:9.7,9.9,10.1,10.2,10.1,则这组数据的方差为_答案:0.032解析:数据 9.7,9.9,10.1,10.2,10.1 的平均数 10,9.7 9.9 10.1 10.2 10.15方差 (0.090.010.010.04 0.01) 0.032.故答案为 0.032.155. 小波一星期的总开支分布图如图所示,一星期的食品开支如图所示,则小波一星期的鸡蛋开支占总开支的百分比为_答案:3%解析:由图可知,鸡蛋占食品开支的比例为 10%,结合图3030 40 100 80 50可知小波在一个星期的鸡蛋开支占总开支的比例为 30%10%3%.1. 绘制频
5、率分布表的步骤(1) 求全距,决定组距和组数,组距 全 距组 数(2) 分组,通常对组内数值所在区间取左闭右开区间,最后一组取 闭区间(3) 登记频数,计算频率,列出频率分布表2. 作频率分布直方图的方法(1) 先制作频率分布表,然后作直角坐标系;(2) 把横轴分成若干段,每一线段对应一个组的组距,然后以此线段为底作一矩形,它的高等于该组的 ,这样得出一系列的矩形频 率组 距(3) 每个矩形的面积恰好是该组的频率,这些矩形就构成了频率分布直方图3. 茎叶图茎相同者共用一个茎(如两位数中的 十位数) ,茎按从小到大的顺序从上向下列出,共茎的叶( 如两位数中的个位数 ),一般按从小到大(或从大到小
6、) 的顺序同行列出这样将样本数据有条理地列出来的图形叫做茎叶图其优点是要样本数据较少时,茎叶图可以保留样本数据的所有信息,直观反映出数据的水平状况、稳定程度,且便于记录和表示;缺点是对差异不大的两组数据不易分析,且样本数据很多时效果不好4. 平均数、标准差和方差设一组样本数据 x1,x 2, xn,其平均数为 x ,则 x ,称x1 x2 xnns2 )2 为这个样本的方差,称其算术平方根 s 为这个样本的标1n ni 1(xi x 1n ni 1(xi x )2准差备课札记题型 1 频率分布直方图及其应用例 1 (2013南京二模)根据 2012 年初我国发布的环境空气质量指数 AQI 技术
7、规定(试行) ,AQI 共分为六级: (0,50为优,(50 ,100为良, (100,150为轻度污染,(150,200为中度污染,(200 ,300 为重度污染,300 以上为严重污染.2012 年 12 月 1 日出版的A 市早报对 A 市 2012 年 11 月份中 30 天的 AQI 进行了统计,频率分布直方图如图所示根据频率分布直方图,可以看出 A 市该月环境空气质量优、良的总天数为_答案:12解析:空气质量优、良的 AQI 指数小于等于 100,由频率分布直方图知,其频率为(0.002 0.006)500.4,所以该市 11 月份中 30 天的空气质量优、良的总天数为0.4301
8、2.备 选 变 式 (教 师 专 享 )(2013常州高级中学模拟)根据国家质量监督检验检疫局发布的车辆驾驶人员血液、呼气酒精含量阈值与检验(GB19522 2004)中规定车辆驾驶人员血液酒精含量: “饮酒驾车非醉酒驾车”的临界值为 20 mg/100 mL;“醉酒驾车”的临界值为 80 mg/100 mL.某地区交通执法部门统计了 5 月份的执法记录数据:血液酒精含量(单位:mg/100 mL) 020 2040 4060 6080 80100人数 180 11 5 2 2根据此数据,可估计该地区 5 月份“饮酒驾车非醉酒驾车”发生的频率为_答案:0.09解析:由统计表可知, “饮酒驾车非
9、醉酒驾车”发生的频数为 115218,所以“饮酒驾车非醉酒驾车”发生的频率为 0.09.18200题型 2 样本的数字特征例 2 (2013江苏)抽样统计甲、乙两位射击运动员的 5 次训练成绩(单位:环),结果如下:运动员 第 1 次 第 2 次 第 3 次 第 4 次 第 5 次甲 87 91 90 89 93乙 89 90 91 88 92则成绩较为稳定(方差较小)的那位运动员成绩的方差为_ 答案:2解析:易得乙较为稳定,乙的平均值为: 90.方差为:x 89 90 91 88 925S2(8990) 2(9090) 2 (9190) 2(88 90) 2(92 90)2/52.变 式 训
10、 练已知 2x11,2x 21,2x 31,2x n1 的方差是 3,则 x1,x 2,x 3,x n 的标准差为_答案:32解析:设 x1,x 2,x 3,x n 的标准差为 s,则 x1,x 2,x 3,x n 的方差是 s2,所以2x11,2x 21,2x 31,2x n1 的方差是 4s2,由题意,4s 23,所以 s .32题型 3 统计知识的综合应用例 3 (2013辽宁)为了考察某校各班参加课外书法小组的人数,从全校随机抽取 5 个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为 7,样本方差为 4,且样本数据互不相同,则样本数据中的最大值为_答案:10解析:由已知
11、可设 5 个班级参加的人数分别为 x1,x 2,x 3,x 4,x 5,又 s24, 7,x 所以(x 17) 2 (x27) 2(x 37) 2(x 47) 2(x 57) 2/54,所以(x 17) 2(x 27)2(x 3 7)2(x 47) 2(x 57) 220,即五个完全平方数之和为 20,要使其中一个达到最大,这五个数必须是关于 0 对称分布的,而 9101920,也就是(3) 2(1)20 21 23 220,所以五个班级参加的人数分别为 4,6,7,8,10,最大数字为 10.备 选 变式 (教 师 专 享 )(2013启东中学训练)在样本的频率分布直方图中,共有 9 个小长
12、方形, 若第一个长方形的面积为 0.02,前五个与后五个长方形的面积分别成等差数列且公差是互为相反数,若样本容量为 1 600,则中间一组( 即第五组) 的频数为_ 答案:360解析:设前五个长方形的面积成等差数列的公差为 d,则 9 个小长方形的面积分别为0.02,0.02d,0.022d,0.023d,0.024d,0.023d,0.022d,0.02d,0.02,而小长方形的面积就是该组数据的频率,从而有 9 个小长方形的面积和为 1,可得2(40.02 d)0.024d1,解得 d .所以第 5 组的频率为432 418000.024 ,故第 5 组的频数为 1 600 360.418
13、00 940 9401. (2013盐城三模)下图是 7 位评委给某作品打出的分数的茎叶图,那么这组数据的方差是_8 8 9 99 0 1 1 2答案:127解析:将茎叶图中的每个数据减去 90,得 7 个数据为2,1,1,0,1,1,2,易得平均数 21101120,所以它们的方差为 s2 (2) 2(1)x 172( 1) 20 2 121 22 2 .这也是原数据的方差1272. 某市高三数学抽样考试中,对 90 分及其以上的成绩情况进行统计,其频率分布直方图如右下图所示,若(130, 140分数段的人数为 90 人,则 (90,100分数段的人数为_答案:810解析:根据直方图,组距为
14、 10,在(130,140 内的 0.005,所以频率为 0.05,因频 率组 距为此区间上的频数为 90,所以这次抽考的总人数为 1 800 人因为(90,100 内的0.045,所以频率为 0.45,设该区间的人数为 x,则由 0.45,得 x810,即频 率组 距 x1 800(90,100分数段的人数为 810.3. 某班有 48 名学生,在一次考试中统计出平均分数为 70,方差为 75,后来发现有 2名同学的成绩有误,甲实得 80 分却记为 50 分,乙实得 70 分却记为 100 分,更正后平均分和方差分别是_答案:70,50解析:易得 没有改变, 70,而 s2 (x x 50
15、2100 2x )x x 148 21 2 24848 275,s 2 (x x 80 270 2x )48 2x 148 21 2 248 x (7548 48 212 50011 300) 48 275 752550.148 x x 1 200484. 某校 100 名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:50 ,60) , 60,70),70,80),80 ,90),90 ,100(1) 求图中 a 的值;(2) 根据频率分布直方图,估计这 100 名学生语文成绩的平均分;(3) 若这 100 名学生语文成绩某些分数段的人数(x) 与数学成绩相应分数段的人数(
16、y) 之比如下表所示,求数学成绩在50,90) 之外的人数.分数段 50,60) 60,70) 70,80) 80,90)xy 11 21 34 45解:(1) 依题意,得 10(2a0.020.030.04) 1,解得 a0.005.(2) 这 100 名学生语文成绩的平均分为550.05650.4750.3850.2950.0573 分(3) 数学成绩在50, 60)的人数为 1000.055,数学成绩在60,70) 的人数为1000.4 20,数学成绩在70,80) 的人数为 1000.3 40,数学成绩在80,90)的12 43人数为 1000.2 25,所以数学成绩在50,90) 之
17、外的人数为 100520402510.541. (2013淮安一模 )已知某同学五次数学成绩分别是:121,127,123,a ,125,若其平均成绩是 124,则这组数据的方差是_答案:4解析:由题意, (121127 123a125) 124,解得 a124,故方差为 s2 (3)15 1523 2( 1) 2 021 24.2. (2013上海文)某学校高一年级男生人数占该年级学生人数的 40%.在一次考试中,男、女生平均分数分别为 75、80,则这次考试该年级学生平均分数为_答案:78解析:平均成绩 75 8078.40100 601003. (2013山东文)将某选手的 9 个得分去
18、掉 1 个最高分,去掉 1 个最低分,7 个剩余分数的平均分为 91,现场做的 9 个分数的茎叶图后来有一个数据模糊,无法辨认,在图中以x 表示:8 7 79 4 0 1 0 x 9 1则 7 个剩余分数的方差为_答案:367解析:由题意,0x9,故去掉的一个最低分为 87,最高分为 99,则有(8794 90919090 x91) 91,解得 x4.所以剩余 7 个数的方差 s2 (8791)17 1722(90 91) 2 2(9191) 2 2(9491) 2 .3674. (2013新课标全国卷)为了比较两种治疗失眠症的药 (分别称为 A 药,B 药)的疗效,随机地选取 20 位患者服
19、用 A 药,20 位患者服用 B 药,这 40 位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h) 试验的观测结果如下:服用 A 药的 20 位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.52.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4服用 B 药的 20 位患者日平均增加的睡眠时间:3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.41.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1) 分别计算两组数据的平均数,从计算结果看,哪种药
20、的疗效更好?(2) 根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?A 药 B 药0.1.2.3.解:(1) 设 A 药观测数据的平均数为 x,B 药观测数据的平均数为 y.由观测结果可得 (0.61.21.21.5 1.51.82.22.32.32.42.52.62.72.72.8x 1202.93.03.13.23.5)2.3, (0.50.50.6 0.80.91.11.21.2 1.31.41.61.71.81.92.1y 1202.42.52.62.73.2) 1.6.由以上计算结果可得 xy, 因此可看出 A 药的疗效更好(2) 由观测结果可绘制如下茎叶图:从以上茎叶图可
21、以看出,A 药疗效的试验结果有 的叶集中在茎 2、3 上,而 B 药疗710效的试验结果有 的叶集中在茎 0、1 上,由此可看出 A 药的疗效更好7101. 总体分布反映的是总体在各个范围内取值的比例情况,而这种分布一般是不清晰的,所以用样本的分布估计总体分布,解频率分布表问题的关键是正确理解频率分布表,注意区分频数、频率的意义2. 对于每个个体所取不同数值较少的个体,常用条形图表示其样本分布,而对于每个个体所取不同数值较多或无限的总体,常用频率分布直方图表示其样本分布解频率分布直方图问题,识图掌握信息是解决问题的关键,特别要注意纵、横坐标代表的意义及单位3. 描述数据的数字特征的有平均数、众数、中位数、方差等,其中平均数、众数、中位数描述其集中趋势,方差反映各个数据与其平均数的离散程度解题时重在理解概念、公式并正确进行计算请 使 用 课 时 训 练 (A)第 3课 时 (见 活 页 ).备课札记