1、专题能力训练20概率、统计与统计案例能力突破训练1.某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30 之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是()A.13B.12C.23D.342.(2021广西上林高三模拟)在样本的频率分布直方图中,共有5个小长方形,若中间一个长方形的面积等于其他4个小长方形面积和的25,且样本容量为140,则中间一组的频数为()A.10B.20C.40D.703.通过随机询问50名性别不同的大学生是否爱好某项运动,得到如下的列联表,由K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),得K
2、2=50(2015-105)2302025258.333.参照附表,得到的正确结论是()性别爱好不爱好合计男生20525女生101525合计302050P(K2k0)0.0100.0050.001k06.6357.87910.828A.在犯错误的概率不超过0.5%的前提下认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.5%的前提下认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下认为“爱好该项运动与性别无关”4.甲、乙两个工厂的轮胎宽度的雷达图如图所示.根据右图中的信息,下面说法错误的是()A.
3、甲厂轮胎宽度的平均数大于乙厂轮胎宽度的平均数B.甲厂轮胎宽度的众数大于乙厂轮胎宽度的众数C.甲厂轮胎宽度的中位数与乙厂轮胎宽度的中位数相同D.甲厂轮胎宽度的极差小于乙厂轮胎宽度的极差5.某城市在城市广场上布置了9个大型花坛A,B,C,D,E,F,G,H,O,9个花坛之间有整齐的方格形道路网,每个方格网均为正方形,如图所示.某人在国庆期间参观、欣赏花坛,他从A花坛开始,在道路网中随机地选择一条最短路径,从E花坛离开,则他经过中心花坛O的概率是()A.13B.23C.14D.346.(2021吉林四平高三模拟)1904年,瑞典数学家柯克构造了一种曲线,取一个正三角形,在每个边以中间的13部分为一边
4、,向外凸出作一个小正三角形,再把原来边上中间的13部分擦掉,就成了一个很像雪花的六角星,如图所示.现在向正三角形的外接圆中均匀地撒放1 000粒豆子,则落在六角星中的豆子数约为()(3,31.732)A.577B.537C.481D.3317.(2021安徽合肥八中高三月考)一个平面封闭图形的周长与面积之比为“周积率”.由三个半圆构成的图形,如图,其中最大半圆的直径为8,若在最大的半圆内随机取一点,该点取自阴影部分的概率为38,则阴影部分的“周积率”为.8.PM2.5是衡量空气污染程度的一个指标,为了解A市空气质量情况,从2020年每天的PM2.5的数据中随机抽取40天的数据,其频率分布直方图
5、如图所示.将PM2.5的数据划分成区间0,100),100,150),150,200),200,250,分别称为一级、二级、三级和四级,统计时用频率估计概率.(1)根据2020年PM2.5的数据估计该市在2021年中空气质量为一级的天数;(2)按照分层抽样的方法,从样本二级、三级、四级中抽取6天的PM2.5数据,再从这6个数据中随机抽取2个,求仅有二级天气的概率.9.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任
6、务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由.(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:生产方式超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否在犯错误的概率不超过 0.01 的前提下认为两种生产方式的效率有差异?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),P(K2k0)0.0500.0100.001k03.8416.63510.82810.某研究机构对某校学生往返校时间的统计资料表明:该校学生居住地到学校的距离x
7、(单位:千米)和学生花费在上学路上的时间y(单位:分钟)有如下的统计资料:到学校的距离x/千米1.82.63.14.35.56.1花费的时间y/分钟17.819.627.531.336.043.2如果统计资料表明y与x有线性相关关系,(1)判断y与x是否有很强的线性相关性?(相关系数r的绝对值大于0.75时,认为两个变量有很强的线性相关性,精确到0.01)(2)求线性回归方程y=bx+a;(精确到0.01)(3)将y7.879,由题表知7.879对应值为0.005,所以在犯错误的概率不超过0.5%的前提下认为“爱好该项运动与性别有关”.故选A.4.B解析:由题意可知甲厂轮胎宽度的平均数是195
8、,众数是194,中位数是194.5,极差是3;乙厂轮胎宽度的平均数是194,众数是195,中位数是194.5,极差是5,则A,C,D正确,B错误.5.B解析:由题中图形知,此人从A花坛开始,在道路网中随机地选择一条最短路径,从E花坛离开,所有最短路径共6条,其中,经过中心花坛O的共4条.故所求概率P=46=23.故选B.6.A解析:设原大正三角形边长为3a(a0),原正三角形外接圆的半径为R(R0),则由正弦定理得3asin60=2R,即R=3a,于是外接圆面积S圆=R2=3a2.又由题意得凸出来的小正三角形边长为a,则S六角星=S大正三角形+3S小正三角形=123a3a32+312aa32=
9、33a2,则S六角星S圆=33a23a2=30.577,所以落在六角星中的豆子数约为10000.577=577.7.83解析:依题意,设较小的白色半圆的半径为r(0r6.635,所以能在犯错误的概率不超过0.01的前提下认为两种生产方式的效率有差异.10.解:(1)r=i=16(xi-x)(yi-y)i=16(xi-x)2i=16(yi-y)280.3082.130.980.75,y与x有很强的线性相关性.(2)依题意得x=16i=16xi=3.9,y=16i=16yi29.23,i=16(xi-x)(yi-y)=80.30,i=16(xi-x)2=14.30.所以b=i=16(xi-x)(y
10、i-y)i=16(xi-x)2=80.3014.305.62.又因为a=y-bx29.23-5.623.97.31,故线性回归方程为y=5.62x+7.31.(3)由(2)可知,当x=3.1时,y3=24.73227,所以满足y0时,-aacosxa,-a-1,0a1;当a=0时,10恒成立;当a0时,aacosx-a,a-1,-1a0.综上,-1a1.函数f(x)=x+asinx在R上单调递增的概率P=25.15.B解析:四个选项的数据都具有对称性,平均数均为2.5,其中B选项的数据中,极端值最多,数据波动程度最大,故选B.16.解析:若两变量x,y具有线性相关关系,即满足y=bx+a,则一
11、定满足y=bx+a,样本点不一定在拟合直线上,故错误,正确;若以模型y=aebx拟合该组数据,z=ln y=bx+ln a=6x+ln 3,故a=3,b=6,故正确;用R2=1-i=1n(yi-yi)2i=1n(yi-y)2来刻画回归模型的拟合效果时,若所有样本点都落在一条斜率为非零实数的直线上,则yi=yi,即R2=1-i=1n(yi-yi)2i=1n(yi-y)2=1-0=1,故正确.17.解:(1)从A,B,C,D,E五名员工中随机抽取2人前往,所有可能的结果如下:(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),(C,D),(C,E),(D,E),共1
12、0个,其中A,B至少有一人被抽到的结果有:(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),共7个,所以A,B至少有一人被抽到的概率是710.(2)根据题中散点图知,指数型y=cdx适合作为网店销售收入y关于月份x的回归方程类型.由y=cdx两边取常用对数,得lgy=lgc+xlgd,而u=lgy,设p=lgc,q=lgd,则回归方程即u=p+qx,于是有p=u-qx,因为x=17(1+2+6+7)=4,u=17i=17lg yi1711.181.60,i=17xiui50.93,i=17xi2=12+22+72=140,所以q=i=17xiui-7xui=1
13、7xi2-7x250.93-411.18140-7160.22,所以p1.60-0.224=0.72,所以c100.725.25,d100.22=101.761857.5418.故网店销售收入y关于月份x的回归方程为y=5.2557.54x8.(3)x=8时,y=5.2557.54=302.085,所以8月份该地区的网店销售收入大约为302.085万元.18.解:(1)由题意知,抽出的20名学生中,来自C班的学生有8名.根据分层抽样方法,C班的学生人数估计为100820=40.(2)设事件Ai为“甲是现有样本中A班的第i个人”,i=1,2,5,事件Cj为“乙是现有样本中C班的第j个人”,j=1
14、,2,8.由题意可知,P(Ai)=15,i=1,2,5;P(Cj)=18,j=1,2,8.P(AiCj)=P(Ai)P(Cj)=1518=140,i=1,2,5,j=1,2,8.设事件E为“该周甲的锻炼时间比乙的锻炼时间长”.由题意知,E=A1C1A1C2A2C1A2C2A2C3A3C1A3C2A3C3A4C1A4C2A4C3A5C1A5C2A5C3A5C4.因此P(E)=P(A1C1)+P(A1C2)+P(A2C1)+P(A2C2)+P(A2C3)+P(A3C1)+P(A3C2)+P(A3C3)+P(A4C1)+P(A4C2)+P(A4C3)+P(A5C1)+P(A5C2)+P(A5C3)+
15、P(A5C4)=15140=38.(3)10.19.解:(1)由已知得林区这种野生动物数量的平均数y=120i=120yi=60,从而该地区这种野生动物数量的估计值为60200=12000.(2)样本(xi,yi)(i=1,2,20)的相关系数r=i=120(xi-x)(yi-y)i=120(xi-x)2i=120(yi-y)2=800809000=2230.94.(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.