1、第二节 用样本估计总体,一、作频率分布直方图的步骤1求极差(即一组数据中 与 的差),2决定 与 ,最大值,最小值,3将数据 ,组数,组距,4列 ,分组,5画 ,频率分布表,频率分布直方图,二、频率分布折线图和总体密度曲线1频率分布折线图:连接频率分布直方图中各小长方形上 端的 ,就得频率分布折线图,2总体密度曲线:随着 的增加,作图时 增加, 减小,相应的频率折线图会越来越接近于一 条光滑曲线,即总体密度曲线,中点,样本容量,所分组数,组距,三、样本的数字特征,最多,最中间,中位数,相等,在频率分布直方图中,中位数、众数与平均数如何确定?,提示:在频率分布直方图中,中位数左边和右边的直方图的
2、面积相等,由此可以估计中位数的值,而平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.众数是最高的矩形的中点的横坐标.,四、茎叶图 茎叶图的优点是可以保留原始数据,而且可以随时记录,1一个容量为32的样本,已知某组样本的频率为0.375, 则该组样本的频数为 () A4B8 C12 D16,解析:频数320.37512.,答案:C,2一个容量为200的样本,数据的分组与几个组的频数如 下表:,则样本的第4组的频率为 ()A0.12 B0.24C0.275 D0.32,解析:x200(45556412)24,频率 0.12.,答案:A,3. 甲、乙两支女子曲棍球队
3、在去年的国际联赛中,甲队平均 每场进球数为3.2,全年比赛进球个数的标准差为3;乙队 平均每场进球数为1.8,全年比赛进球个数的标准差为0.3. 下列说法正确的个数为 () 甲队的技术比乙队好;乙队发挥比甲队稳定; 乙队几乎每场都进球;甲队的表现时好时坏 A1 B2 C3 D4,解析:四种说法都正确,甲队的平均进球数多于乙队,故第一句正确;乙队标准差较小,说明技术水平稳定;甲队平均进球数是3.2,但其标准差却是3,离散程度较大,由此可判断甲队表现不稳定;平均进球数是1.8,标准差只有0.3,每场的进球数相差不多,可见乙队的确很少不进球,答案:D,4如图是某兴趣小组学生在一次数学测验中 的得分茎
4、叶图,则该组男生的平均得分与 女生的平均得分之差是_,解析:男生的平均得分为78.7,女生的平均得分为77.2得分之差为1.5.,答案:1.5,5甲、乙两人比赛射击,两人所得的平均环数相同,其 中甲所得环数的方差为5,乙所得环数如下:5,6,9,10,5, 那么这两人中成绩较稳定的是_,解析: (57)2(67)2(97)2(107)2(57)2 (41494)4.4.乙稳定,答案:乙,频率分布直方图反映样本的频率分布:(1)频率分布直方图中横坐标表示组距,纵坐标表示 ,频率组距(2)频率分布直方图中各小长方形的面积之和为1,因此在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频
5、率比,(3)频率分布表和频率分布直方图是一组数据频率分布的两 种形式,前者准确,后者直观(4)众数为最高矩形中点的横坐标(5)中位数为平分频率分布直方图面积且垂直于横轴的直线 与横轴交点的横坐标,为了了解某校初中毕业男生的体能状况,从该校初中毕业班学生中抽取若干名男生进行铅球测试,把所得数据(精确到0.1米)进行整理后,分成6组画出频率分布直方图的一部分(如下图),已知从左到右前5个小组的频率分别为0.04,0.10,0.14,0.28,0.30.第6小组的频数是7.,(1)请将频率分布直方图补充完整;,(2)该校参加这次铅球测试的男生有多少人?(3)若成绩在8.0米以上(含8.0米)的为合格
6、,试求这次铅球测试的成绩的合格率;(4)在这次测试中,你能确定该校参加测试的男生铅球成绩的众数和中位数各落在哪个小组内吗?,根据频率分布直方图的含义可求.,【解】(1)由频率分布直方图的意义知,各小组频率之和为1,故第6小组的频率为1(0.040.100.140.280.30)0.14.易知第6小组与第3小组的频率相等,故两个小长方形等高,图略(2)由(1)知,第6小组的频率是0.14,又因为第6小组的频数是7,现设参加这次测试的男生有x人,根据频率定义,得 0.14,即x50(人)(3)由图可知,第4、5、6小组成绩在8.0米以上,其频率之和为0.280.300.140.72.故合格率为72
7、%.(4)能确定中位数落在第4小组,而众数落在第5小组,1本例条件不变,现欲从参加铅球测试的学生中抽取10 人,调查他们铅球状况,则成绩在8.85,9.75的学生 应抽取几人?,解:由于参加铅球测试的学生的成绩存在较大差异,故可用分层抽样进行,成绩在8.85,9.75的学生应抽取0.3050 3人.,由于茎叶图较好地保留了原始数据,所以可以帮助我们分析样本数据的大致概率分布在利用茎叶图分析数据特点时,要注意区别茎与叶,(2009安徽高考)某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A:357,359,
8、367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430,(1)完成数据的茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论,由数据可得茎叶图,结合茎叶图的特点得出结论.,【解】(1),(2)由
9、于每个品种的数据都只有25个,样本不大,画茎叶图很方便;此时茎叶图不仅清晰明了地展示了数据的分布情况 ,便于比较,没有任何信息损失,而且还可以随时记录新的数据(3)通过观察茎叶图可以看出:品种A的亩产平均数(或均值)比品种B高;品种A的亩产标准差(或方差)比品种B大,故品种A的亩产稳定性较差,2如图是某电视台综艺节目举办的挑战主持人大赛上, 七位评委为某选手打出的分数的茎叶统计图,去掉一 个最高分和一个最低分后,所剩数据的平均数和方差 分别为 () A84,4.84B84,1.6 C85,4 D85,1.6,解析:由茎叶图可知评委打出的最低分为79,最高分为93,其余得分为84,84,86,8
10、4,87,故平均分为 85,方差为 3(8485)2(8685)2(8785)21.6.,答案:D,3从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度 (单位:mm),结果如下: 甲品种:271273280285285287292294295 301303303307308310314319323 325325328331334337352 乙品种:284292295304306307312313315 315316318318320322322324327 329331333336337343356,由以上数据设计了如下茎叶图:,根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个
11、统计结论:_;_.,解:可从以下几个结论中任意写出两个乙品种棉花的纤维平均长度大于甲品种棉花的纤维平均长度(或:乙品种棉花的纤维长度普遍大于甲品种棉花的纤维长度)甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散(或:乙品种棉花的纤维长度较甲品种棉花的纤维长度更集中(稳定)甲品种棉花的纤维长度的分散程度比乙品种棉花的纤维长度的分散程度更大),甲品种棉花的纤维长度的中位数为307 mm,乙品种棉花的纤维长度的中位数为318 mm.乙品种棉花的纤维长度基本上是对称的,而且大多集中在中间(均值附近)甲品种棉花的纤维长度除一个特殊值352外,也大致对称,其分布较均匀.,1平均数与方差都是重要的数字特征,
12、是对总体的一种简 明的描述,它们所反映的情况有着重要的实际意义, 平均数、中位数、众数描述其集中趋势,方差和标准 差描述波动大小,2平均数、方差的公式推广 (1)若数据x1,x2,xn的平均数为 ,那么mx1a, mx2a,mx3a,mxna的平均数是m a. (2)数据x1,x2,xn的方差为s2. s2 数据x1a,x2a,xna的方差也为s2; 数据ax1,ax2,axn的方差为a2s2.,甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图,(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价,(1)先通过图象统计出甲、乙二人的成绩;(2)
13、利用公式求出平均数、方差,再分析两人的 成绩,作出评价.,【解】(1)由图象可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分 (1013)2(1313)2(1213)2(1413)2(1613)24, (1313)2(1413)2(1213)2(1213)2(1413)20.8.,(2)由 ,可知乙的成绩较稳定从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高,4从某学校高三年级共800名男生中随机抽取50名测量 身高,测量发现被测学生身高全部介于155 cm和195 c
14、m 之间,将测量结果按如下方式分成八组:第一组 155,160);第二组160,165)、第八组190,195,下 图是按上述分组方法得到的频率分布直方图的一部分, 已知第一组与第八组人数相同,第六组、第七组、第 八组人数依次构成等差数列,(1)估计这所学校高三年级全体男生身高180 cm以上(含180 cm)的人数;(2)求第六组、第七组的频率并补充完整频率分布直方图;(3)若从身高属于第六组和第八组的所有男生中随机抽取两名男生,记他们的身高分别为x、y,求满足|x-y|5的事件概率,解:(1)由频率分布直方图知,前五组频率为(0.008+0.016+0.04+0.04+0.06)5=0.8
15、2,后三组频率为1-0.82=0.18.这所学校高三男生身高在180 cm以上(含180 cm)的人数为8000.18=144人(2)由频率分布直方图得第八组频率为0.0085=0.04,人数为0.0450=2人,设第六组人数为m,则第七组人数为0.1850-2-m=7-m,又m+2=2(7-m),所以m=4,即第六组人数为4人,第七组人数为3人,频率分别为0.08,0.06.,频率除以组距分别等于0.016,0.012,见图.,(3)由(2)知身高在180,185)内的人数为4人,设为a、b、c、d.身高在190,195的人数为2人,设为A、B.若x,y180,185)时,有ab,ac,ad
16、,bc,bd,cd共六种情况若x,y190,195时,有AB共一种情况若x,y分别在180,185,190,195内时,有aA,bA,cA,dA,aB,bB,cB,dB共8种情况所以基本事件的总数为6+8+1=15种事件|x-y|5所包含的基本事件个数有6+1=7种,故P(|x-y|5)=,用样本去估计总体是考查的重点内容,一是利用频率分布直方图去估计总体,二是利用茎叶图估计总体,三是利用样本数字特征去估计总体.近几年高考,频率分布直方图、茎叶图在解答题中时有出现.2009年广东高考综合考查了平均数、样本方差及概率的计算.综合性强、立意新颖.,(2009广东高考)随机抽取某中学甲、乙两班各10
17、名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图:,(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差;(3)现从乙班这10名同学中随机抽取两名身高不低于173 cm的同学,求身高为176 cm的同学被抽中的概率,解(1)乙班的平均身高较高(可由茎叶图判断或计算得出)(2)因为甲班的平均身高为所以甲班的样本方差 21222922221272820257.2.,(3)从乙班这10名同学中随机抽取两名身高不低于173 cm的同学,共有10种不同的取法:(173,176),(173,178),(173,179),(173,181),(176,178),(176,179),(176,181),(178,179),(178,181),(179,181)设A表示随机事件“抽到身高为176 cm的同学”,则A中的基本事件有四个:(173,176),(176,178),(176,179),(176,181)故所求概率为P(A),根据茎叶图判断时要注意数据分布的对称性或直接计算,(3)问抽取两名身高不低于173 cm的同学,易漏情况造成丢分,注意按顺序书写另外,在本题条件下,同学们看能否解决一下问题(1)计算乙班的样本方差(2)从甲班中任抽求身高为179 cm的同学被抽中的概率,