1、第四章 统计与概率,第16课 数据的收集与整理,基础知识 自主学习,要点梳理 1.数据收集的途径(1)直接手段: 、 、 、 等(2)间接途径: 等 2.数据整理的方法: 、 、 、 等 3.平均数、总体、个体、样本及样本容量(1)总体: 的全体叫总体(2)个体: 叫做个体(3)样本:从总体中所抽取的 叫做总体的一个样本(4)样本容量:样本中 叫做样本容量,调查,观察,测量,实验,查阅文献资料、使用互联网查询,分类,排序,分组,编码,把所要考察对象,每一个考察对象,一部分个体,个体的数目,4众数与中位数在一组数据中,出现次数最多的那个数据叫做这组数据的 将一组数据按大、小依次排列,把排在正中间
2、的一个数据称为 但中位数并不一定是数据中的一个数当数据的个数是偶数个时,最中间有两个数,这两个数的平均数就是这组数据的中位数;如果数据的个数是奇数个时,中位数是正中间的那个数,众数,中位数,难点正本 疑点清源,1理解全面调查和抽样调查的优缺点统计调查是收集数据常用的方法,一般有全面调查和抽样调 查两种,实际中常常采用抽样调查的方式全面调查可以直接获得总体的情况,调查的结果准确,但搜 集、整理、计算数据的工作量大;抽样调查的调查范围小,节省 人力、物力,但往往不如全面调查得到的结果准确抽样调查是 实际中应用非常广泛的一种调查方式,它是从总体中抽取样本进 行调查,根据样本来估计总体的一种调查调查收
3、集数据的过程:(1)明确调查问题;(2)确定调查对象; (3)选择调查方法;(4)展开调查;(5)记录结果;(6)得出结论,2在恰当的场合选用平均数、中位数和众数平均数、中位数和众数可以简单地作为一组数据的代表,但是在使用 它们代表一组数据的同时,也丢失了原始数据的一些具体信息因此,我 们需要了解这三种代表数各自的优缺点,并在恰当的场合选用合适的代表 数平均数的优点:平均数的计算过程中用到了一组数据中的每一个数, 因此比中位数和众数更灵敏,反映了更多数据的信息其缺点是:计算较 麻烦,而且容易受到极端值的影响中位数的优点:计算简单,不容易受极端值的影响确定了中位数之 后,可以知道小于中位数的数值
4、和大于中位数的数值在这组数据中各占一 半中位数的缺点:除了中间的值以外,不能反映其他数据的信息众数的优点:众数很容易从直方图中获得,它可以清楚地告诉我们在 一组数据中哪个或哪些数值出现的次数最多众数的缺点:并不能反映众 数比其他数出现的次数多多少,而且也丢失了很多其他数据的信息平均数、众数和中位数都是描述一组数据集中趋势的统计量,但它们 描述的角度和适用范围有所不同根据平均数、中位数和众数不同的特 点,我们可以扬长避短,根据具体情况,选用合适的代表数,3适当地选用极差、方差与标准差极差、方差和标准差都是衡量一组数据波动大小的量,一组 数据的极差、方差、标准差越小,这组数据的波动越小,也就越 稳
5、定反之,一组数据的极差、方差、标准差越大,这组数据的 波动越大,也就越不稳定它们三者的不同之处是:极差反映的 是一组数据的变化范围的大小,方差和标准差反映的是数据在它 的平均数据附近波动的情况极差的不足之处在于只和极端值相关,而方差则弥补了这一 不足方差可以比较全面地反映一组数据相对于平均值的波动情 况只是计算比较复杂,方差的数量单位是原 数据数量单位的平 方因此,标准差更为常用适当地选用极差、方差和标准差,我们就可以较为方便地刻 画一组数据的波动情况和离散程度了,基础自测,1(2011扬州)下列调查中,适合用普查方式的是( )A了解一批炮弹的杀伤半径B了解扬州电视台关注栏目的收视率C了解长江
6、中鱼的种类D了解某班学生对“扬州精神”的知晓率答案 D解析 一个班学生人数有限,采用普查得到的结果准确 2(2011潼南)下列说法中正确的是( )A“打开电视,正在播放新闻联播”是必然事件B想了解某种饮料中含色素的情况,宜采用抽样调查C数据1,1,2,2,3的众数是3D一组数据的波动越大,方差越小答案 B解析 了解饮料含色素的情况,具有破坏性,宜抽查,3(2011株洲)株洲市关心下一代工作委员会为了了解全市初三学生的视力状况,从全市30000名初三学生中随机抽取了500人进行视力测试,发现其中视力不良的学生有100人,则可估计全市30000名初三学生中视力不良的约有( )A100人 B500人
7、C6000人 D15000 人答案 C,4(2011威海)今年体育学业考试增加了跳绳测试项目,下面是测试时记录员记录的一组(10名)同学的测试成绩(单位:个/分钟)176 180 184 180 170176 172 164 186 180该组数据的众数、中位数、平均数分别为( )A180,180,178 B180,178,178C180,178,176.8 D178,180,176.8答案 C解析 数据180出现的次数最多,众数为180;将这组数据按大、小依次排列,发现中间两个数据是180、176,其平均数为178,为中位数;整组数据的平均数,答案 D,题型分类 深度剖析,题型一 选择合适的
8、调查方式 【例1】下列调查适合作普查的是( )A了解在校大学生的主要娱乐方式B了解宁波市居民对废电池的处理情况C日光灯管厂要检测一批灯管的使用寿命D对甲型H1N1流感患者的同一车厢的乘客进行医学检查答案 D探究提高 全面调查可以直接获得总体的情况,调查的结果准确,但搜集、整理、计算数据的工作量大;抽样调查的范围小,节省人力、物力,但往往不如全面调查的结果准确调查范围的大小是相对而言的,类似的问题应联系实际才不会出错,知能迁移1 (2011宜昌)要调查城区九年级8000名学生了解禁毒知识的情况,下列调查方式最合适的是( )A在某校九年级选取50名女生B在某校九年级选取50名男生C在某校九年级选取
9、50名学生D在城区8000名九年级学生中随机选取50名学生答案 D解析 D选取的样本具代表性.,题型二 平均数、众数、中位数的计算 【例2】(1)有19位同学参加歌咏比赛,所得的分数互不相同,取得分前10位同学进入决赛某同学知道自己的分数后,要判断自己能否进入决赛,他只需知道这19位同学成绩的( )A平均数 B中位数 C众数 D方差答案 B (2)“一方有难,八方支援”,当青海玉树发生地震后,全国人民积极开展捐款捐物献爱心活动,下列是我市某中学七年级二班50名同学捐款情况统计表:根据表中所提供的信息,这50名同学捐款金额的众数是( )A.15 B30 C50 D20答案 B 探究提高 平均数、
10、众数、中位数是中考的热点之一,解决这类问题的关键是弄清概念平均数的大小与一组数据里的每一个数据均有关系,其中任何一个数据的变动都会引起平均数的变动;众数着眼于各数据出现的频率,其大小只与这组数据中的部分数据有关,可以是一个或多个;中位数则与数据的排列位置有关,某些数据的变动对中位数没有影响,计算时要分清数据是奇数个,还是偶数个,知能迁移2 (1)某校乒乓球训练队共有9名队员,他们的年龄(单位:岁)分别为:12,13,13,14,12,13,15,13,15,则他们的年龄的众数是( )A12 B13 C14 D15答案 B (2)(2011益阳)“恒盛”超市购进一批大米,大米的标准包装为每袋30
11、kg,售货员任选6袋进行了称重检验,超过标准重量的记作“”,不足标准重量的记作“”,他记录的结果是0.5,0.5,0,0.5,0.5,1,那么这6袋大米重量的平均数和极差分别是( )A0,1.5 B29.5,1 C30,1.5 D30.5,0答案 C (3)(2011潍坊)某市2011年5月1日10日十天的空气污染指数的数据如下(主要污染物为可吸入颗粒物):61,75,70,56,81,91,92,91,75,81.那么该组数据的极差和中位数分别是( ) A36,78 B36,86 C20,78 D20,77.3答案 A,题型三 极差、方差、标准差的计算 【例3】(1)(2010郴州)要判断小
12、刚的数学考试成绩是否稳定,那么需要知道他最近连续几次数学考试成绩的( )A方差 B中位数 C平均数 D众数答案 A (2)给出一组数据:23,22,25,23,27,25,23,则这一组数据的中位数是_;方差(精确到0.1)是_答案 23;2.6解析 将这组数据从小到大排列22,23,23,23,25,25,27,可知中位数是23,又平均数,知能迁移3 (1)在一次体检中,测得某小组5位同学的身高分别是170、162、155、160、168(单位:厘米),则这组数据的极差是_厘米答案 15解析 极差最大数最小数,17015515. (2)一组数据:1,2,a 的平均数是0,那么这组数据的方差是
13、_答案 2,题型四 利用统计量,解决实际问题 【例 4】某公司招聘职员,对应聘者的专业知识、英语水平、参加社会实践与社团活动等三项进行测试或成果认定,三项得分满分都为100分,三项分数按532的比例记入每人的最后总分(100分),有4名应聘者的得分如下表所示:,(1)写出4位应聘者的总分; (2)就表中专业知识、英语水平、参加社会实践与社团活动等三项的得分,分别求出三项中4人所得分数的方差; (3)由(1)和(2),你对应聘者有何建议?,解题示范规范步骤,该得的分,一分不丢!,知能迁移4 (2011芜湖)某中学开展“唱红歌”比赛活动,九年级(1)、(2)班根据初赛成绩,各选出5名选手参加复赛,
14、两个班各选出的5名选手的复赛成绩(满分为100分)如图所示(1)根据图示填写下表;(2)结合两班复赛成绩的平均数和中位数,分析哪个班级的复赛成绩较好;(3)计算两班复赛成绩的方差,易错警示,10选用合适的公式计算平均数 试题 某校七年级六个班的人数依次为52人,55人,53人,51人,54人,52人,各班的期末数学平均成绩分别为95分,91.5分,93分,95分,91分,93.5分,求七年级期末数学考试的平均成绩,故知七年级期末数学考试的平均成绩为93.2分,剖析 七年级的平均成绩应该是七年级每个学生成绩的平均数,题目已知六个班各班的平均成绩,求这个年级的平均成绩,只需分别求出每个班的总分数,
15、这些总分数的和就是这个年级所有学生成绩的和,再除以年级总人数,就是所求的这个年级的平均成绩,而上面的错解把六个班的平均成绩的平均数误当成年级的平均成绩,导致了错误,故知该校七年级期末数学成绩的平均成绩为93.1分批阅笔记 当一组数据中有不少数据重复出现时,可用加权平均数公式来计算平均数,思想方法 感悟提高,方法与技巧 1.普查得到结果准确,但工作量大、难度大,而抽样调查工作量小,便于进行,但结果带有估计性,有误差,因此在选择过程中应根据实际情况而定一般地,对必须要得到准确结果的,而且又能进行普查的,选择普查,而当调查具有破坏性时只能采用抽样调查,但要注意,抽样调查所选择的样本必须要具有代表性
16、2.一组数据的众数有时不止一个,当一组数据中有两个或三个数据出现的次数一样多并且是最多时,这几个数都是众数,而中位数只有一个,3. 平均数反映了一组数据的平均大小,常用来代表数据的总体“平均水平”中位数像一条分界线,将数据分成前半部分和后半部分,因此用来代表一组数据的“中等水平”众数反映了出现次数最多的数据,用来代表一组数据的“多数水平”可见这三个统计量意义有所不同,在实际问题分析中,应根据不同要求合理选择 4. 方差是用来衡量数据波动大小的,方差越小,说明越稳定,方差越大说明越不稳定,它是我们衡量一种产品是否合格的一种方法将原数据同时加上或减去一个数,这组数据的方差不会变,而将这组数据都扩大
17、n倍时,方差将扩大n2倍 5. 样本容量没有单位,方差的单位是原数据单位的平方,标准差的单位与原数据单位一致,失误与防范 1. 当一组数据较大时,求平均数应先减去一个适当的数,利用简化公式进行计算,这样还可以避免错误 2. 中位数并不是指一组数据中间位置的数,而是要求将这一组数据按大小依次排列后的中间数直接从没有按大小顺序依次排列的一组数据中间位置求中位数是错误的 3. 在一组数据中,出现次数最多的数据叫做这组数据的众数,把这些数据出现的次数,当成了出现次数最多的数据是错误的 4. 方差的计算公式直观地说明了一组数据的方差必定是非负数,若计算方差时出现了负数,就可以肯定是计算中有错误 5. 用平均数的大小是不能判定产品是否合乎要求的,而应结合数据整体的波动性来考察,完成考点跟踪训练16,