1、数据的收集知识要点: 1数据收集的过程:明确调查问题,确定调查对象,选择调查方法,展开调查,记录结果(一般以表格形式),得出结论。 2在一次实验统计中,某个对象出现的次数称为它的频数;这个次数与总次数的比值(或百分比),称为它出现的频率。频数和频率能反映出该对象出现的频繁程度。 3随着实验次数增加,频数也会跟着增加,但频率始终在 0 和 1 之间。 例题解析: 例 1 建国以来,我国已经进行了五次人口普查,下表是历次普查得到的全国人口数量统计表:普查年份 1953 1964 1982 1990 2000 人口数(亿) 5.94 6.95 10.08 11.34 12.95 请问: (1) 19
2、53 年我国人口数量是_亿,2000 年我国人口数量是_亿; (2) 从 1953 年至 2000 年,我国人口数量增加了_亿。 解:(1)5.94,12.95; (2)7.01 例 2 下面是几次投掷硬币的试验结果,仔细观察并回答下列问题:(1)第一次试验中,正面朝上的频数为 ,反面朝上的频率为 。 (2)第二次试验中,反面朝上的频数为 ,出现正面的频率为 。 (3)第三次试验中,正面朝上的频率为 ,反面朝上的频率为 ,两种频率的和为 。 (4)第四次试验中,正面朝上的频率为 ,反面朝上的频率为 ,两种频率的和为 。 (5)四次试验中抛掷硬币的总次数为 ,出现反面朝上的总次数为 。 分析:注
3、意频数表示该对象出现的次数,而频数则表示频数与总数的比。 解:(1)正面朝上的频数为 14,反面朝上的频率为 = 。 (2)反面朝上的频数为 20,出现正面的频率为 。 (3)正面朝上的频率为 = ,反面朝上的频率为 = ,两种频率的和为 。 (4)正面朝上的频率为 ,反面朝上的频率为 ,两种频率的和为 。 (5)四次试验中抛掷硬币的总次数为 30+40+50+60=180,出现反面朝上的总次数为 16+20+24+31=91。 例 3 以下图表为某小学五年级的体育成绩统计表,观察表中数据并回答下列问题:学号 成绩 学号 成绩 学号 成绩 学号 成绩1 78 6 85 11 86 16 83
4、2 86 7 66 12 94 17 96 3 67 8 90 13 84 18 75 4 54 9 89 14 79 19 62 5 91 10 77 15 48 20 71 学号 成绩 学号 成绩 学号 成绩 学号 成绩21 88 26 100 31 91 26 65 22 78 27 85 32 86 27 59 23 65 28 79 33 87 28 92 24 88 29 84 34 84 29 76 25 63 30 52 35 78 40 87 问:(1)这个班的学生成绩分布在 90100 的频数为多少,频率为多少? (2)这个班的学生成绩分布在 8089 的频数为多少,频率为
5、多少? (3)这个班的学生成绩分布在 7079 的频数为多少,频率为多少? (4)这个班的学生成绩分布在 6069 的频数为多少,频率为多少? (5)这个班的学生不及格的频数为多少,频率为多少? (6)综上所得结果,这个班的成绩分布在哪个分数段的人数最多? 分析:可以采用画“正”的方法进行统计。结果如下:分数段 90100 8089 7079 6069 不及格结果解:(1)这个班的学生成绩分布在 90100 的频数为 7,频率为 ; (2)这个班的学生成绩分布在 8089 的频数为 14,频率为 ; (3)这个班的学生成绩分布在 7079 的频数为 9,频率为 ; (4)这个班的学生成绩分布在
6、 6069 的频数为 6,频率为 ; (5)这个班的学生不及格的频数为 4,频率为 ; (6)观察在这五个频数中 14 最大,而相应的频率 也是最大的频率,所以这个班的成绩分布在 8089 分数段的人数最多。 例 4 下面是某工厂工人的生日情况统计方格图,试回答下列问题:图 5-1 问:生日分布在 13 月份的频数为多少?46 月份的呢?79 月份的呢?1012 月份的呢?它们的频率又分别为几? 分析:看条形图,首先要注意各个长方形分别代表哪一项,要求某时间段内的频数,只要把相应的长方形的数据相加即可。 解:生日分布在 13 月份的频数为: 2500+1100+3300=6900 生日分布在
7、46 月份的频数为: 5300+2200+1500=9000 生日分布在 79 月份的频数为: 4500+3500+1200=9200 生日分布在 1012 月份的频数为: 2100+3600+2200=7900 总数为:6900+9000+9200+7900=33000 故各自的频率为:13 月份为:690033000=20.91% 46 月份为:900033000=27.27% 79 月份为:920033000=27.88% 1012 月份为:790033000=23.94% 练习: 1请设计一张关于全班同学早上起床时间的统计表,将其分成 5:30 之前,5:305:59,6:006:29
8、,6:306:59,7:00 之后,这五个时间段,看看落在哪个时间段的频数最多。5:30 之前 5:305:59 6:006:29 6:306:59 7:00 之后频数 频率 2拿一个骰子,假设连续抛掷 30 次为一组,对每一组记录下得到点数为4 的频数,算出频率,再多做两组看看得到的结果有没有规律。30 次 60 次 90 次出现点数为 4 的频数 相应的频率 3取两个硬币,每一次都同时抛出,连续抛 20 次,记下两次都是正面朝上的次数,计算出频率。再把试验重做四遍,看看五次得到的频率是否相近,如果是,都接近哪个数?20 次 40 次 60 次 80 次 100 次都是正面朝上的频数相应的频
9、率 4拿一副扑克牌(52 张)。每次取出一张,然后放回去,连续做 30 次,记录下得到的是红桃或梅花之一的频数,计算出频率。再将试验重做三次,看看得到的频率是否接近,如果是,都接近于几?30 次 60 次 90 次 120 次抽到红桃或梅花的频数 相应的频率 5以下是某数的前 105 位数,计算其中数字 0 出现的频率:100111000011111000000111111100000000111111111000000000011111111111000000000000111111111111100000000000000 练习答案: 1234 略。 5解:0 出现的频数为:2+4+6+1
10、4=(2+14)27=56,从而频率为:56105=53.3%。 一普查、总体、个体、抽样调查、样本的概念 为了一定的目的而对考察的对象进行全面的调查,称为普查。在统计中,我们把所要考察的对象的全体叫做总体总体中每一个考察对象叫做个体从总体中所抽取的一部分个体叫做总体的一个样本样本中个体的数目叫做样本容量要注意:这里所谓“考察对象”是指数据,不是指事物本身例如:要考察“某市全体学生的身高”,总体是指“全体学生的身高”而不是“全体学生”样本中的个体也是指数据 二频率分布的几个概念: 每个小组内数据的个数叫做这个小组的频数组距是指每个小组的两个端点的距离。每个小组的频数与数据总数的比值叫做这一小组
11、的频率用表格的形式把各小组的频数、频率表示出来,可以知道一组数据在各个小组内所占的比例大小,这样的表格称为频率分布表 三求频率分布的步骤: (1)计算极差;(2)决定组距和组数;(3)决定分点;(4)列频率分布表;(5)画频率分布直方图 例题解析 例 1为了让人们感受丢弃塑料袋对环境造成的影响,某班环保小组的六名同学记录了自己家中一周内丢弃的塑料袋的数量,结果如下(单位:个):33 25 28 26 25 31如果该班有 45 名学生,那么根据提供的数据估计本周全班同学各家总共丢弃塑料袋的数量约为( ) A、900 个 B、1080 个 C、1260 个 D、1800 个 答案:C 例 2某班
12、同学参加环保知识竞赛,将学生的成绩(得分取整数)进行整理后分成五组,绘成频率分布直方图图中从左到右各小组的小长方形的高的比是1:3:6:4:2,最右边一组的频数是 6结合直方图提供的信息,解答下列问题: (1)该班共有多少名同学参赛? (2)成绩落在哪组数据范围内的人数最多,是多少? (3)求成绩在 60 分以上(不含 60 分)的学生占全班参赛人数的百分率图 14-3 考点:频率分布 评析:此题分三问,根据给出的长方形的高的比和频数的比是一样的,由最右边一组的频数是 6,可求出各组频数是 3,9,18,12,6,则第一问可求,结果为 48;第二问根据直方图可知落在 70.580.5 的人数最
13、多,结果是 18;第三问 60 以上的是 45 人,占百分率为 100%=93.75%解题过程如下: 解: (1)由直方图的意义可知:小长方形高的比等于频数的比 由最右边一组的频数为 6 可得: 各组频数依次是 3,9,18,12,6 3+9+18+12+6=48,共有 48 个数据,即有 48 名学生参赛 (2)成绩落在 70.580.5 数据范围内的人数最多,人数为 18 (3)60 分以上的人数是 45 所占全班参赛人数的百分率为: 100%=93.75% 例 3为增强学生的身体素质,某校坚持长年的全员体育锻炼,并定期进行体能测试下面是将某班学生的立定跳远成绩(精确到 0.01 米)进行
14、整理后,分成 5 组,画出的频率分布直方图的一部分已知从左到右 4 个小组的频率分别是 0.05, 0.15,0.30, 0.35,第 5 小组的频数是 9图 14-4 (1)请将频率分布直方图补充完整; (2)该班参加这次测试的学生有多少人? (3)若成绩在 2.00 米以上(含 2.00 米)的为合格,问该班成绩的合格率是多少? (4)这次测试中,你能肯定该班学生成绩的众数和中位数各落在哪一小组内吗?(只需写出能或不能,不必说明理由) 考点:频率分布直方图的应用 评析:因为一个样本的频率总和为 1,所以易知,第五组的频率为 0.15 和第二组相同,因此直方图与它相同又因为第五组的频数是 9
15、,所以参加测试人数为 90.15=60 人,因为后三组的频率之和为 0.80,所以该班成绩合格率为80%虽然在第四组的人数多,但不能确定中位数或众数根据直方图不能确定中位数和众位数在哪一组内解题过程如下:图 14-5 解: (1)把直方图补充完整(如图所示) (2)因为第 5 小组的频率是 0.15,频数是 9,所以该班参加这次测试学生的人数是:90.15=60 (人) (3)因为第 3、4、5 各小组的频率之和为 0.80,所以该班成绩的合格率是80% (4)不能肯定众数和中位数各在哪一小组内 真题专练 1(北京朝阳区)甲乙二人参加某体育项目训练,为了便于研究,把最近五次训练成绩分别用实线和
16、虚线连结,如图 14-6 所示,下面的结论错误的是( )图 14-6 A、乙的第二次成绩与第五次成绩相同 B 、第三次测试甲的成绩与乙的成绩相同 C 、第四次测试甲的成绩比乙的成绩多 2 分 D、五次测试甲的成绩都比乙的成绩高 2(重庆市)如图 14-7 所示的是初三某班 60 名同学参加初三数学毕业会考所得成绩(成绩均为整数)整理后画出的频率分布直方图,根据图中可得出该班及格(60 分以上)的同学的人数为 人图 14-7 3(黑龙江省哈尔滨市)为了解某中学初中三年级 300 名男学生的身体发育情况,从中对 20 名男学生的身高进行了测量,结果如下:(单位:厘米) 175 161 171 17
17、6 167 181 161 173 171 177 179 172 165 157 173 173 166 177 169 181 下表是根据上述数据填写的频率分布表的一部分: (1)请填写表中未完成的部分 (2)样本数据中,男生身高的众数是多少厘米? (3)根据表中数据整理与计算回答:该校初中三年级男学生身高在171.5176.5(厘米)范围内的人数为多少分 组 频数累计 频数 频率156.5161.5 3 0.15 161.5166.5 丅 2 0.10 166.5171.5 4 0.20 171.5176.5 正 0.30 176.5181.5 正 5 合 计 20 1.00 4(安徽省
18、)随机抽取某城市 30 天的空气质量状况统计如下:污染指数(w) 40 70 90 110 120 140 天数 (t) 3 5 10 7 4 1 其中,w50 时,空气质量为优;50w100 时,空气质量为良;100w150 时,空气质量为轻微污染估计该城市一年(以 365 天计)中有多少天空气质量达到良以上 5(福建福州)为了了解中学生的体能情况,某校抽取了 50 名初三学生进行一分钟跳绳次数测试,将所得数据整理后,画出部分频率分布直方图如图所示,已知图中从左到右前四个小组的频率分别为0.04、0.12、0.4、0.28根据已知条件填空或画图: (1)第四小组频数为 ; (2)第五小组频率
19、为 ; (3)在这次测试中,跳绳次数的中位数落在第 小组中; (4)补全频率分布直方图图 14-8 6(山西省)在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为 5 月 1 日至 30 日评委会把同学们上交作品的件数按 5 天一组分组统计,绘制了频率分布直方图如下已知从左到右各长方形的高的比为234641,第三组的频数为 12,请解答下列问题: (1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数量最多?有多少件? (3)经过评比,第四组和第六组分别有 10 件、2 件作品获奖,问这两组哪组获奖率较高?图 14-9 7(上海市)小李通过对某地区域 1998 年至 20
20、00 年快餐公司发展情况的调查,制成了该地区快餐公司个数情况的条形图(如图 14-10 图 2)和快餐公司盒饭年销量的平均数情况条形图(如图 14-10 图 3) 利用图 14-10 图 2、图 14-10 图 3 共同提供的信息 解答下列问题: (1)1999 年该地区销售盒饭共 万盒 (2)该地区盒饭销量最大的年份是 年,这一年的年销量是 万盒 (3)这三年中该地区每年平均销售盒饭多少万盒?图 14-10 答案:1、D 2、45 3、 ()6,0.25(见表) ()样本数据中,男生身高的众数是 173 厘米 ()男学生身高在 171.5176.5 厘米范围内的人数是 6 人,频率是0.30
21、, 3000.30=90(人) 答:300 名男学生中,身高在 171.5176.5 厘米范围内的人数为 90 人 4、解:根据题意,随机抽取的 30 天中,空气质量达到良以上的是: 3+5+10=18(天) 随机抽取的 30 天中,空气质量达到良以上的天数所占比例是: =0.6 估计全年 365 天中空气质量达到良以上的天数为: 3650.6=219 (天) 5、(1)4 ()0.16 (3)三 (4)略 6、解:(1) = = , 12 =60(件) 答:本次活动共有 60 件作品参加评比 (2)60 =18(件) 答:第四组上交的作品数量最多,有 18 件 (3)第四姐获奖率为 = ,第六组获奖率为 = 答:第六组获奖率较高 7、(1)118 (2)2000,120 (3)解: = =96(万盒) 这三年中,该地区每年平均销售盒饭 96 万盒