收藏 分享(赏)

数学:2.1《抽样方法》学案(苏教版必修3).doc

上传人:无敌 文档编号:528416 上传时间:2018-04-09 格式:DOC 页数:6 大小:369.50KB
下载 相关 举报
数学:2.1《抽样方法》学案(苏教版必修3).doc_第1页
第1页 / 共6页
数学:2.1《抽样方法》学案(苏教版必修3).doc_第2页
第2页 / 共6页
数学:2.1《抽样方法》学案(苏教版必修3).doc_第3页
第3页 / 共6页
数学:2.1《抽样方法》学案(苏教版必修3).doc_第4页
第4页 / 共6页
数学:2.1《抽样方法》学案(苏教版必修3).doc_第5页
第5页 / 共6页
点击查看更多>>
资源描述

1、统 计抽样方法1.抽样方法:(1)简单随机抽样(抽签法、随机数表法)常常用于总体个数较少时,它的特征是从总体中逐个抽取;(2)系统抽样也叫等距离抽样,常用于总体个数较多时,它的主要特征是均衡成若干部分,每部分只取一个;(3)分层抽样,主要特征是分层按比例抽样,主要用于总体中有明显差异,它们的共同点:每个个体被抽到的概率都相等 ,体现了抽样的客观性和平等性。nN如(1)某社区有 500 个家庭,其中高收入家庭 125 户,中等收入家庭 280 户,低收入家庭 95。为了调查社会购买力的某项指标,要从中抽取一个容量为 100 户的样本,把这种抽样记为 A;某中学高中一年级有 12 名女排运动员,要

2、从中选取 3 人调查学习负担的情况,把这种抽样记为 B,那么完成上述两项调查应分别采用的抽样方法:A 为_,B 为_。 (答:分层抽样,简单随机抽样) ;(3)某中学有高一学生 400 人,高二学生 300 人,高三学生 300 人,现通过分层抽样抽取一个容量为 n 的样本,已知每个学生被抽到的概率为 0.2,则 n= _(答: 200) ;(4)容量为 100 的样本拆分成 10 组,前 7 组的频率之和为 0.79,而剩下的三组的频数组成等比数列,且其公比不为 1,则剩下的三组中频数最大的一组的频率是_(答:0.16) ;(5)用简单随机抽样的方法从含有 10 个个体的总体中,抽取一个容量

3、为 2 的样本,则某一个体“第一次被抽到的概率” , “第一次未被抽到,第二次被抽到的概率” , “在整个抽样过程中被抽到的概率”a分别是_(答: ) ;1,052.总体分布的估计:用样本估计总体,是研究统计问题的一个基本思想方法,即用样本平均数估计总体平均数(即总体期望值描述一个总体的平均水平) ;用样本方差估计总体方差(方差和标准差是描述一个样本和总体的波动大小的特征数,方差或标准差越小,表示这个样本或总体的波动越小,即越稳定)。一般地,样本容量越大,这种估计就越精确。总体估计要掌握:(1) “表”(频率分布表);(2) “图”(频率分布直方图)。频率分布直方图的特征:(1)从频率分布直方

4、图可以清楚的看出数据分布的总体趋势。(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。频率直方图的作法:(1)算数据极差 ;minax(2)决定组距和组数;(3)决定分点;(4)列频率分布表;(5)画频率直方图。提醒:直方图的纵轴(小矩形的高 )一般是频率除以组距的商(而不是频率),横轴一般是数据的大小,小矩形的面积表示频率。组数的决定方法是:设数据总数目为 n, 时,分为 组;508时,分为 组.10n128如(1)一个容量为 20 的样本数据,分组后组距与频数如下: (10,20,2;(20,30,3 ;(30,40,4;(40,50,5;(5

5、0,60,4;(60,70,2;则样本在区间 上的频率为 50,(A5% B25% C50% D70%(答:D) ;(2)已知样本:10 8 6 10 13 8 10 12 11 7 8 9 11 9 12 9 10 11 12 12 ,那么频率为 0.3 的范围是A5.57.5 B7.59.5 C9.511.5 D11.513.5 (答:B ) ;(3)观察新生儿的体重,其频率分布直方图如图所示,则新生儿的体重在2700,3000 的频率为_(答:0.3) ;(4)如图,是一次数学考试成绩的样本频率分布直方图(样本容量 n=200) ,若成绩不低于 60 分为及格,则样本中的及格人数是_(答

6、:120) ;(5) 有同一型号的汽车 100 辆,为了解这种汽车每蚝油 1L 所行路程的情况,现从中随即抽出 10 辆在同一条件下进行蚝油 1L 所行路程实验,得到如下样本数据(单位:km ):13.7,12.7,14.4,13.8,13.3,12.5,13.5,13.6,13.1,13.4,其分组如下:(1)完成上面频率分布表;(2)根据上表,在给定坐标系中画出频率分布直线图,并根据样本估计总体数据落在12.95,13.95)中的概率;(3)根据样本,对总体的期望值进行估计解:(1)频率分布表:分组 频数 频率12.45,12.95) 2 0.212.95,13.45) 3 0.313.4

7、5,13.95) 4 0.413.95,14.45) 1 0.1合计 10 1.0分组 频数 频率12.45,12.95)12.95,13.45)13.45,13.95)13.95,14.45)合计 10 1.0O 2400 2700 360033003000 3900 体重(g)率0.001分数频率/组距0 20 40 60 80 1000.0180.0120.0090.0060.005(2)频率分布直方图:估计总体数据落在12.95,13.95)中的概率为 0.7(3) 13.40.7(3)1.480(.5).6014x因此,总体的期望值进行估计约为 13.4. (6)为了了解高一学生的体

8、能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为 2:4:17:15:9:3,第二小组频数为 12.(1) 第二小组的频率是多少?样本容量是多少?(2) 若次数在 110 以上(含 110 次)为达标,试估计该学校全体高一学生的达标率是多少?(3) 在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由。分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于 1。解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因

9、此第二小组的频率为: 40.8217593又因为频率=,所以 第 二 小 组 频 数样 本 容 量 1250.8第 二 小 组 频 数样 本 容 量 第 二 小 组 频 率(2)由图可估计该学校高一学生的达标率约为 1759310%84(3)由已知可得各小组的频数依次为 6,12,51,45,27,9,所以前三组的频数之和为 69,前四组的频数之和为 114,所以跳绳次数的中位数落在第四小组内。3、样本平均数: 。121()nixxn如有一组数据:x 1,x2,xn(x1x 2x n),它们的算术平均值为 20,若去掉其中的 xn,余下数据的90 100110120130140150次数o0.

10、0040.0080.0120.0160.0200.0240.028频率/组距0.0320.036算术平均值为 18,则 xn 关于 n 的表达式为 (答: ) 。218nx4、样本方差: ;2221()()()sx 21()niix样本标准差: 。22nxn如(1)甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了 5 次,成绩如下表(单位:环)甲 10 8 9 9 9乙 10 10 7 9 9如果甲、乙两人中只有 1 人入选,则入选的应是 (答:甲) ;(2)已知实数 的期望值为 ,方差为 , ,若 ,)2(,2nx x2Sniiaxm12)(x则一定有 A B C D 与 无法比

11、较大小(答:B) ;mS2S222(3)某班 40 人随机平均分成两组,两组学生一次考试的成绩情况如下表:则全班的平均分为_,方差为_(答:85,51)提醒:若 的平均数为 ,方差为 ,则 的平均数为12,nx x2s12,naxbaxb,方差为 。abas如已知数据 的平均数 ,方差 ,则数据 的平均, 542S73,7321数和标准差分别为 A15,36 B22,6 C15,6 D22,36 (答:B)5.茎叶图(1) 茎叶图的画法:将每个数据分为茎(高位)与叶(低位)两部分,将最大茎和最小茎之间的数按大小顺序排成一列,将各数据的叶依先后次序写在其茎的左(右)两侧.(2)茎叶图的特征:()

12、用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。()茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。6. 独立性检验独立性检验是检定两个事件间是否独立的统计方法,是卡方检验的一个应用. 卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验.即根据样本的频数分布来推断总体的分布,卡方独立性检验的零假设是各事件之间相互独立.卡方值永远大于零. 2 的两个临界值分别是 3

13、.841,与 6.635. 3.841 时,接受假设即两事件无关 .2x相关系数是测定变量之间相关密切程度和相关方向的代表性指标。相关系数用符号“r ”表示,其特点表现在:参与相关分析的两个变量是对等的,不分自变量和因变量,改变两变量的地位并不影响相关系统计量组别平均分 方差第 1 组 80 16第 2 组 90 36数的数值,因此相关系数只有一个;相关系数有正负号反映相关系数的方向,正号反映正相关,负号反映负相关; 回归和相关都是研究两个变量相互关系的分析方法。相关分析研究两个变量之间相关的方向和相关的密切程度。但是相关分析不能指出两变量相互关系的具体形式,也无法从一个变量的变化来推测另一个

14、变量的变化关系。回归方程则是通过一定的数学方程来反映变量之间相互关系的具体形式,以便从一个已知量来推测另一个未知量。为估算预测提供一个重要的方法。相关性检验的步骤是:(1) 做统计假设:x 与 Y 不具备线性相关关系.(2) 根据小概率 0.05 与 查出2nr 的一个临界值.(3)根据样本相关系数公式计算出 r 的值.(4)作统计推断:如果 表明 95%的0.5,r把握认为 x 与 Y 之间具备线性相关关系,如果 接受假设.05,提醒:A 与 B 有关并不意味着 A 的发生必然导致 B 的发生.7.回归分析回归分析是对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,确定一个相

15、应的数学表达式,以便从一个已知量来推测另一个未知量,为估计预测提供一个重要的方法。在回归分析中,由 X 推算 Y 与由 Y 推算 X 的回归方程是不同的,不可混淆: .与相2(),iixybabx由 x推 y 2(),iixyaxby由 y推 关分析相比,回归分析的特点是:两个变量是不对等的,只能用自变量来估计因变量,而不允许由因变量来推测自变量,必须区分自变量,一般说,事物的原因作自变量 X.回归分析和相关分析是互相补充、密切联系的。相关分析需要回归分析来表明现象数量相关的具体形式,而回归分析则应该建立在相关分析的基础上。依靠相关分析表明现象的数量变化具有密切相关,进行回归分析求其相关的具体

16、形式才有意义。如(1)在研究色盲与性别的关系调查中,调查了男性 480 人,其中有 38 人患色盲,调查的 520 个女性中 6 人患色盲,(1)根据以上的数据建立一个 22 的列联表;(2)若认为“性别与患色盲有关系” ,则出错的概率会是多少解:(1)患色盲 不患色盲 总计男 38 442 480女 6 514 520总计 44 956 1000(2)假设 H :“性别与患色盲没有关系”先算出 K 的观测值: 210(38546)7.1429k率则有 2(10.8).P即是 H 成立的概率不超过 0.001,若认为“性别与患色盲有关系” ,则出错的概率为 0.001(2)一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果:转速 x(转/秒) 16 14 12 8每小时生产有缺点的零件数 y(件) 11 9 8 5(1)画出散点图(2)如果 y 对 x 有线性相关关系,求回归直线方程; (3)若实际生产中,允许每小时的产品中有缺点的零件最多为 10 个,那么机器的运转速度应控制在什么范围内?答案:(2)y=0.7286x-0.8571(3)x 小于等于 14.9013

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 中等教育 > 小学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报