1、 2018 届学科网二轮透析高考数学 23 题对对碰【二轮精品】 第三篇 主题 18 随机变量分布列与统计(理) 【主题考法】本主题考题类型为解答题,以应用题为背景以茎叶图、频率分布直方图、条形图等统计数表为载体,考查运用排列组合值求古典概型、几何概型、互斥事件和概率公式、相互独立事件积概率、条件概率、n 次独立重复试验、离散型随机变量分布列及其期望与方差、正态分布等数学知识与方法,考查抽样方法、总体估计、回归分析与独立性检验等统计知识和方法,考查运算求解能力、阅读理解能力、应用意识,难度为中档题,分值 12 分.【主题考前回扣】1.抽样方法简单随机抽样、分层抽样、系统抽样从容量为 N 的总体
2、中抽取容量为 n 的样本,则每个个体被抽到的概率都为 ;nN分层抽样实际上就是按比例抽样,即按各层个体数占总体的比确定各层应抽取的样本容量2.统计中四个数据特征众数:在样本数据中,出现次数最多的那个数据;中位数:在样本数据中,将数据按大小排列,位于最中间的数据如果数据的个数为偶数,就取中间两个数据的平均数作为中位数;平均数:样本数据的算术平均数,即 (x1x 2 xn);x1n方差与标准差方差:s 2 (x1 )2( x2 )2(x n )21n x x x标准差:学科=网s .1nx1 x2 x2 x2 xn x23.直方图的三个结论小长方形的面积组距 频率;频 率组 距各小长方形的面积之和
3、等于 1;小长方形的高 ,所有小长方形高的和为 .频 率组 距 1组 距4.回归分析(1)回归直线 x 经过样本点的中心点( , ),若 x 取某一个值代入回归直线y b a xy方程 x 中,可求出 y 的估计值.y b a 5.独立性检验对于取值分别是x 1,x 2和 y1,y 2的分类变量 X 和 Y,其样本频数列联表是:y1 y2 总计x1 a b abx2 c d cd总计 ac bd n则 K2 (其中 nab cd 为样本容量).n(ad bc)2(a b)(c d)(a c)(b d)利用随机变量 K2 来判断“两个分类变量有关系 ”的方法称为独立性检验如果 K2 的观测值 k
4、 越大,说明“两个分类变量有关系”的可能性越大6.牢记概念与公式(1)概率的计算公式古典概型的概率计算公式P(A) ;事 件 A包 含 的 基 本 事 件 数 m基 本 事 件 总 数 n互斥事件的概率计算公式P(AB )P( A)P(B) ;对立事件的概率计算公式P( )1P(A );A几何概型的概率计算公式P(A) .构 成 事 件 A的 区 域 长 度 面 积 或 体 积 试 验 的 全 部 结 果 所 构 成 的 区 域 长 度 面 积 或 体 积 7.八组公式离散型随机变量的分布列的两个性质()p i0( i1,2,n);()p 1p 2p n1.期望公式E(X)x 1p1x 2p2
5、x npn.期望的性质()E (aXb)aE( X)b;()若 XB (n,p),则 E(X)np;()若 X 服从两点分布,则 E(X)p.方差公式D(X)x 1E( X)2p1x 2E( X)2p2 xnE( X)2pn,标准差为 .DX方差的性质()D(aXb)a 2D(X);()若 XB (n,p),则 D(X)np(1p);()若 X 服从两点分布,则 D(X)p(1p) 独立事件同时发生的概率计算公式P(AB)P( A)P(B)独立重复试验的概率计算公式Pn(k)C pk(1p) nk .kn条件概率公式P(B|A) .PABPA【易错点提醒】1.混淆频率分布条形图和频率分布直方图
6、,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错2.利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者的含义:(1)最高的小长方形底边中点的横坐标即是众数;学- 科网(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和3.在独立性检验中,K 2 (其中 nabc d)所给出的检验随机变量 K2 的观测n(ad bc)2(a b)(a c)(b d)(c d)值 k,并且 k 的值越大,说明“X 与 Y 有关系”成立的可能性越大,可以利用数据来确定“X
7、与 Y 有关系”的可信程度.4.混淆直线方程 yax b 与回归直线 x 系数的含义,导致回归分析中致误 .y b a 5.应用互斥事件的概率加法公式,一定要注意首先确定各事件是否彼此互斥,然后求出各事件分别发生的概率,再求和6正确区别互斥事件与对立事件的关系:对立事件是互斥事件,是互斥中的特殊情况,但互斥事件不一定是对立事件, “互斥”是“对立”的必要不充分条件7.要注意概率 P(A|B)与 P(AB)的区别(1)在 P(A|B)中,事件 A,B 发生有时间上的差异,B 先 A 后;在 P(AB)中,事件 A,B 同时发生(2)样本空间不同,在 P(A|B)中,事件 B 成为样本空间;在 P
8、(AB)中,样本空间仍为 ,因而有 P(A|B)P(AB)8易忘判定随机变量是否服从二项分布,盲目使用二项分布的期望和方差公式计算致误【主题考向】考向一 抽样方法与总体估计【解决法宝】1.分层抽样的本质是按比例确定每层抽取个体的个数。2.解决总体分布估计问题,若利用频率分布直方图求众数,即最高的小长方形底边中点的横坐标即是众数;若利用频率分布直方图求为中位数,即利用中位数左边和右边的小长方形的面积和是相等的求解;若为利用频率分布直方图求平均数,即为频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和;若为估计某个范围上的概率或频数,根据频率分布直方图求出该范围上所有频率之和即为概
9、率,频率乘以样本容量即为频数.3.给出样本的茎叶图,出现次数最多的样本数据即为众数,数据从小到大排成一列,若中间为一个数,该数为中位数,若中间为两个数,则中间两个数的平均值为中位数,均值和方差利用均值和方差公式计算出样本的均值和方差即为总体的均值与方差.例 1 【宁夏石嘴山市三中 2018 届一模】某校从参加高一年级期末考试的学生中抽出 60 名学生,将其数学成绩(均为整数)分成六段 后,画出如下部分频率分布直方图.观察图形的信40,5,6.90,1息,回答下列问题:(1)求第四小组的频率,补全频率分布直方图,并求样本数据的众数,中位数,平均数 和方差 , (同x2s一组中的数据用该区间的中点
10、值作代表) ;(2)从被抽取的数学成绩是 分以上(包括 分)的学生中选两人,求他们在同一分数段的概率;7070(3)假设从全市参加高一年级期末考试的学生中,任意抽取 个学生,设这四个学生中数学成绩为 分480以上(包括 分)的人数为 (以该校学生的成绩的频率估计概率) ,求 的分布列和数学期望.80XX【分析】 (1)通过各组的频率和等于 ,求出第四组的频率,考查直方图,面积一半的横坐标就是中位数,1每个矩形的中点横坐标与该矩形的纵坐标相乘后求和,即可得到平均数,最高矩形的中点横坐标为众数,利用方差公式可求得方差 ;(2)分别求出 , , 的人数是 , , ,s70,8,90,11853然后根
11、据组合知识利用古典概型概率求解即可;(3) , 即可4,0.3XB440.37kkpXC写出分布列,利用二项分布的期望公式可得结果.【解析】 (1)因为各组的频率和等于 1,故第四组的频率:.4(0.25.*0.f.5)*03直方图如图所示.中位数是 ,.1773.cx样本数据中位数是 分.众数是 75; =71; =194(2) , , 的人数是 , , ,所以从成绩是 分以上(包括 分)70,8,90,118537070的学生中选两人,他们在同一分数段的概率:.221853670CP考向二 独立性检验【解决法宝】对独立性检验问题,根据条件列出 22 列联表,根据实际问题需要的可信度确定临界
12、值 ;利用公式 = ,由观测数据计算得到随机变量 的观测值 ;如果0k2K2()(nadbc2Kk ,就以 的把握认为“ 与 有关系”;否则就说样本观测值没有提供“ 与0(11%PkXYX有关系”的充分证据.Y例 2【云南省保山市 2018 届第二次市统测某校进行文科、理科数学成绩对比,某次考试后,各随机抽取 100 名同学的数学考试成绩进行统计,其频率分布表如下.()根据数学成绩的频率分布表,求理科数学成绩的中位数的估计值;()请填写下面的列联表,并根据列联表判断是否有 90%的把握认为数学成绩与文理科有关:()设文理科数学成绩相互独立,记 表示事件“文科、理科数学成绩都大于等于 120 分
13、”,估计 的概A A率.附: 22nadbcKd20Pk0.100 0.050 0.025 0.010 0.00102.706 3.841 5.024 6.635 10.828【分析】 (1)利用频率分布直方图求出中位数的估计值;(2)计算 ,根据表格中的数据,作出判断;2K(3)记 B 表示“ 文科数学成绩大于等于 120 分”,C 表示“理科数学成绩大于等于 120 分”,由于文理科数学成绩相互独立,利用概率乘法公式即可得到结果.【解析】 ()理科数学成绩的频率分布表中,成绩小于 105 分的频率为 0.350.5,故理科数学成绩的中位数的估计值为 分 150.310.6254()根据数学
14、成绩的频率分布表得如下列联表:数学成绩 分120数学成绩 分6.635 ,有 的把握认为箱积水量与取水方法有关.14. 【广东广州市 2018 届一调】某基地蔬菜大棚采用水培、无土栽培方式种植各类蔬菜过去 50 周的资料显示,该地周光照量 (小时)都在 30 小时以上,其中不足 50 小时的周数有 5 周,不低于 50 小时且X不超过 70 小时的周数有 35 周,超过 70 小时的周数有 10 周根据统计,该基地的西红柿增加量 (百斤)y与使用某种液体肥料 (千克)之间对应数据为如图所示的折线图x(1)依据数据的折线图,是否可用线性回归模型拟合 与 的关系?请计算相关系数 并加以说明(精确y
15、xr到 001) (若 ,则线性相关程度很高,可用线性回归模型拟合)0.75r(2)蔬菜大棚对光照要求较大,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪最多可运行台数受周光照量 限制,并有如下关系:X周光照量 (单位:小时)X30507X70光照控制仪最多可运行台数 3 2 1若某台光照控制仪运行,则该台光照控制仪周利润为 3000 元;若某台光照控制仪未运行,则该台光照控制仪周亏损 1000 元若商家安装了 3 台光照控制仪,求商家在过去 50 周周总利润的平均值附:相关系数公式 ,参考数据 , 1221niiini ii ixyr0.35【解析】 (1)由已知数据可得 4
16、5684, 4xy因为 51310316iiixy,522221 5ii , 522221101iiy所以相关系数 2211690.515niiini ii ixyr因为 ,所以可用线性回归模型拟合 与 的关系.0.75(2)记商家周总利润为 元,由条件可知至少需安装 1 台,最多安装 3 台光照控制仪Y安装 1 台光照控制仪可获得周总利润 3000 元安装 2 台光照控制仪的情形:当 X 70 时,只有 1 台光照控制仪运行,此时周总利润 Y=3000-1000=2000 元,当 3070 时,只有 1 台光照控制仪运行,此时周总利润 Y=13000-21000=1000 元,当 50X70
17、时,有 2 台光照控制仪运行,此时周总利润 Y=23000-11000=5000 元,当 30X70时,3 台光照控制仪都运行,周总利润 Y=33000=9000 元,故 的分布列为Y1000 5000 900002 07 01所以 元10.5.79.146EY综上可知,为使商家周总利润的均值达到最大应该安装 2 台光照控制仪15.【山东省济南市 2018 届一模】2018 年 2 月 22 日上午,山东省省委、省政府在济南召开山东省全面展开新旧动能转换重大工程动员大会,会议动员各方力量,迅速全面展开新旧动能转换重大工程.某企业响应号召,对现有设备进行改造,为了分析设备改造前后的效果,现从设备
18、改造前后生产的大量产品中各抽取了 200 件产品作为样本,检测一项质量指标值,若该项质量指标值落在 内的产品视为合格品,否20,4则为不合格品.图 3 是设备改造前的样本的频率分布直方图,表 1 是设备改造后的样本的频数分布表.表 1:设备改造后样本的频数分布表(1)完成下面的 列联表,并判断是否有 99%的把握认为该企业生产的这种产品的质量指标值与设备2改造有关;(2)根据图 3 和表 1 提供的数据,试从产品合格率的角度对改造前后设备的优劣进行比较;(3)企业将不合格品全部销毁后,根据客户需求对合格品进行等级细分,质量指标值落在 内的定25,30为一等品,每件售价 240 元;质量指标值落
19、在 或 内的定为二等品,每件售价 180 元;其20,53,它的合格品定为三等品,每件售价 120 元.根据表 1 的数据,用该组样本中一等品、二等品、三等品各自在合格品中的频率代替从所有产品中抽到一件相应等级产品的概率.现有一名顾客随机购买两件产品,设其支付的费用为 (单位:元) ,求 的分布列和数学期望.XX附: 20PKk0.150 0.100 0.050 0.025 0.01002.072 2.706 3.841 5.024 6.63522nadbcKd【解析】 (1)根据图 3 和表 1 得到 列联表:设备改造前 设备改造后 合计合格品 172 192 364不合格品 28 8 36
20、合计 200 200 400将 列联表中的数据代入公式计算得:2.2nadbcKd2401728936410 ,12.06.35有 99%的把握认为该企业生产的这种产品的质量指标值与设备改造有关.(2)根据图 和表 可知,设备改造前产品为合格品的概率约为 ,设备改造后产品为合格品的1 1724305概率约为 ;显然设备改造后产品合格率更高,因此,设备改造后性能更优.92405(3)由表 1 知:一等品的频率为 ,即从所有产品中随机抽到一件一等品的概率为 ;2 12二等品的频率为 ,即从所有产品中随机抽到一件二等品的概率为 ;3 3三等品的频率为 ,即从所有产品中随机抽到一件三等品的概率为 .16 16由已知得:随机变量 的取值为: , , , , .X240304280,240PX( ) 3,3( ) 1269C,6( ) 158,40PX( ) 123.8( ) 4随机变量 的分布列为:X240 300 360 420 480P136195181314