1、第 4 课时:总体分布的估计(一)【目标引领】1学习目标:体会分布的意义和作用,学会列频率分布表,会画频率分布条形图、直方图,会用频率分布表或分布条形图、直方图估计总体分布,并作出合理解释。在解决问题过程中,进一步体会用样本估计整体的思想,认识统计的实际作用,初步经历收集数据到统计数据的全过程,体会统计思维与确定性思维的差异。2学法指导:当总体中的个体取不同数值很少时,可用频率分布表或频率分布条形图估计总体分布;当总体中的个体取不同数值较多,甚至无限时,可用频率分布表或频率分布直方图估计总体分布。【教师在线】1解析视屏:(1) 频率分布表:当总体很大或不便于获得时,可以用样本的频率分布来估计总
2、体的频率分布。我们把反映总体频率分布的表格为频率分布表。(2) 编制频率分布表的步骤: 求全距,决定组数和组距,组距= ;组 数全 距 分组,区间一般左闭右开(为了遵循统计分组穷尽和互斥原则,所以统计上规定,凡是总体某一个单位的变量值是相邻两组的界限值,这一个单位归入作为下限值的那一组内,即所谓“上限不在内”原则) ; 登记频数,计算频率,列出频率分布表。(3) 条形图:条形图是用宽度相同的条形的高度或长度来表示数据变动的图形。条形图可以横置也可以纵置,纵置时又称为柱形图,也就是说,当各类别放在纵轴时,称为条形图;当各类别放在横轴时,称为柱形图。(4) 频率分布直方图:直方图是用矩形的宽度和高
3、度来表示频率分布的图形(在平面直角坐标中,横轴表示数据分组,即各组组距,纵轴表示频率) 。(5)直方图与条形图的不同点: 条形图是用条形的长度表示各类别频数的多少,其宽度(表示类别)是固定的;直方图是用面积表示各组频率的多少,矩形的高度表示每一组的频率除以组距,宽度则表示各组的组距,因此其高度与宽度均有意义。 此外,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。2经典回放:例 1 :为检测某产品的质量,抽取了一个容量为 30 的样本,检测结果为一级品 5 件,二级品 8 件,三级品 13 件,次品 4 件。 列出样本的频率分布表;此种产品为二级品或三级品的概率?能
4、否画出样本分布的条形图?分析:当总体中的个体取不同数值很少时,可用频率分布表或频率分布条形图估计总体分布。解:频率分布表如下:产品 频数 频率一级品 5 0.17二级品 8 0.27三级品 13 0.43次品 4 0.13合计 30 1频率分布条形图:点评:频率分布表中通常有频数、累计频数,频率、累计频率等。其中所有频数的和即样本容量的大小,而所有频率的和恰好为 1。例 2:为了了解某地区高三学生的身体发育情况,抽查了地区内 100 名年龄为 17.5 岁18岁的男生的体重情况,结果如下(单位:kg)56.5 69.5 65 61.5 64.5 66.5 64 64.5 76 58.572 7
5、3.5 56 67 70 57.5 65.5 68 71 7562 68.5 62.5 66 59.5 63.5 64.5 67.5 73 6855 72 66.5 74 63 60 55.5 70 64.5 5864 70.5 57 62.5 65 69 71.5 73 62 5876 71 66 63.5 56 59.5 63.5 65 70 74.568.5 64 55.5 72.5 66.5 68 76 57.5 60 71.557 69.5 74 64.5 59 61.5 67 68 63.5 5859 65.5 62.5 69.5 72 64.5 75.5 68.5 64 6265
6、.5 58.5 67.5 70.5 65 66 66.5 70 63 59.5试根据上述数据画出样本的频率分布直方图,并对相应的总体分布作出估计 解:按照下列步骤获得样本的频率分布.(1)求最大值与最小值的差.在上述数据中,最大值是 76,最小值是 55,它们的差(又称为极差)是 7655=21)所得的差告诉我们,这组数据的变动范围有多大.体体体体/体体54.5 64.566.562.560.558.556.5 68.570.5 72.5 74.5 76.5(2)确定组距与组数.如果将组距定为 2,那么由 212=10.5,组数为 11,这个组数适合的.于是组距为 2,组数为 11.(3)决定
7、分点.根据本例中数据的特点,第 1 小组的起点可取为 54.5,第 1 小组的终点可取为 56.5,为了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是“左闭右开”的.这样,所得到的分组是54.5,56.5) , 56.5,58.5) , 74.5,76.5).(4)列频率分布表,如表 频率分布表分组 频数累计 频数 频率54.5,56.5) 2 2 0.0256.5,58.5) 8 6 0.0658.5,60.5) 18 10 0.1060.5,62.5) 28 10 0.1062.5,64.5) 42 14 0.1464.5,66.5) 58 16 0.1666.5,6
8、8.5) 71 13 0.1368.5,70.5) 82 11 0.1170.5,72.5) 90 8 0.0872.5,74.5) 97 7 0.0774.5,76.5) 100 3 0.03合计 100 1.00(5)绘制频率分布直方图.频率分布直方图如图所示在得到了样本的频率后,就可以对相应的总体情况作出估计.例如可以估计体重在 64.5,66.5)kg 的学生最多,约占学生总数的 16%;体重小于 58.5kg的学生较少,约占 8%;等等 点评:由于图中各小长方形的面积等于相应各组的频率,这个图形的面积反映了数据落在各个小组的频率的大小.在反映样本的频率分布方面,频率分步表比较准确,频
9、率分布直方图比较直观,它们起着相互补充的作用.【同步训练】1.在用样本频率估计总体分布的过程中,下列说法中正确的是( )总体容量越大,估计越精确 总体容量越小,估计越精确样本容量越大,估计越精确 样本容量越小,估计越精确2. 一个容量为的样本,分成若干组,已知某数的频数和频率分别为 50 和 0.25,则 3. 一个容量为 32 的样本,已知某组的样本的频率为 0.25,则该组样本的频数为( ) 4某校为了了解学生的课外阅读情况,随机调查0.5人数(人)时间(小时)201050 1.0 1.5 2.015某 市 居 民 关 注 不 同 类 型 广 告 人 数 分 布 图050100150商品广
10、 告服务广 告金融广 告房地产 广告招生招聘广告其他广 告人数0.30.14.3 4.4 4.5 4.6 4.7 4.8 4.9 5.0 5.1 5.2视力频 率组 距了 50 名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用右侧的条形图表示. 根据条形图可得这 50 名学生这一天平均每人的课外阅读时间为 ( )0.6 小时 0.9 小时 ()A()B1.0 小时 1.5 小时CD5.(江西卷)为了解某校高三学生的视力情况,随机地抽查了该校 100 名高三学生的视力情况,得到频率分布直方图,如右,由于不慎将部分数据丢失,但知道前 4 组的频数成等比数列,后 6 组的频数成等差数列,设
11、最大频率为 a,视力在 4.6 到 5.0 之间的学生数为 b,则 a, b 的值分别为( )A0,27,78 B 0,27,83C2.7,78 D 2.7,836用条形图表示下表中关注不同广告的人数、频率。广告类型 人数 比例 频率%商品广告 112 0.560 56服务广告 51 0.255 25.5金融广告 9 0.045 4.5房地产广告 16 0.080 8招生招聘广告 10 0.050 5其他广告 2 0.010 1合计 200 1.000 100【拓展尝新】7下表给出了某学校 120 名 12 岁男生的身高统计分组与频数(单位:cm) 区间 122,126) 126,130) 1
12、30,134) 134,138) 138,142) 142,146) 146,150) 150,154) 154,158)人数 5 8 10 22 33 20 11 6 5(1)列出样本的频率分布表(含累积频率) ;(2)画出频率分布直方图;(3)根据累积频率分布,估计小于 134 的数据约占多少百分比【解答】1 2200 3 4B5A 6解:人数分布条形图如下频 率 %0102030405060商品广告服务广告金融广告房地产广 告招生招聘 广告其他广告频率分布条形图如下7解:(1)样本的频率分布表与累积频率表如下:(2)频率分布直方图如下:(3)根据累积频率分布,小于 134 的数据约占 2310%9.2区间 122,126) 126,130) 130,134) 134,138) 138,142) 142,146) 146,150) 150,154) 154,158)人数 5 8 10 22 33 20 11 6 5频率 412601416120124累积频率 03823931