1、 2018 届学科网二轮透析高考数学 23 题对对碰【二轮精品】 第三篇主题 18 统计与概率(文) 【主题考法】本主题考题形式为解答题,以应用题为背景以茎叶图、频率分布直方图、条形图等统计数表为载体,考查抽样方法、总体估计、回归分析、独立性检验、古典概型、几何概型及互斥事件的概率求法等概率统计知识与方法,考查应用意识、运算求解能力,难度为中档试题,分值为 12 分.【主题考前回扣】1.抽样方法简单随机抽样、分层抽样、系统抽样从容量为 N 的总体中抽取容量为 n 的样本,则每个个体被抽到的概率都为 ;nN分层抽样实际上就是按比例抽样,即按各层个体数占总体的比确定各层应抽取的样本容量2.统计中四
2、个数据特征众数:在样本数据中,出现次数最多的那个数据;中位数:在样本数据中,将数据按大小排列,位于最中间的数据如果数据的个数为偶数,就取中间两个数据的平均数作为中位数;平均数:样本数据的算术平均数,即 (x1x 2 xn);x1n方差与标准差方差:s 2 (x1 )2( x2 )2(x n )21n x x x标准差:s .1nx1 x2 x2 x2 xn x23.直方图的三个结论小长方形的面积组距 频率;频 率组 距各小长方形的面积之和等于 1;小长方形的高 ,所有小长方形高的和为 .频 率组 距 1组 距4.回归分析(1)回归直线 x 经过样本点的中心点( , ),若 x 取某一个值代入回
3、归直线y b a xy方程 x 中,可求出 y 的估计值.y b a 5.独立性检验对于取值分别是x 1,x 2和 y1,y 2的分类变量 X 和 Y,其样本频数列联表是:y1 y2 总计x1 a b abx2 c d cd总计 ac bd n则 K2 (其中 nab cd 为样本容量).n(ad bc)2(a b)(c d)(a c)(b d)利用随机变量 K2 来判断“两个分类变量有关系 ”的方法称为独立性检验如果 K2 的观测值 k 越大,说明“两个分类变量有关系”的可能性越大6.古典概型的概率(1)公式 P(A) .mn A中 所 含 的 基 本 事 件 数基 本 事 件 总 数(2)
4、古典概型的两个特点:所有可能出现的基本事件只有有限个;每个基本事件出现的可能性相等.7.几何概型的概率(1)P(A) .构 成 事 件 A的 区 域 长 度 (面 积 或 体 积 )试 验 的 全 部 结 果 所 构 成 的 区 域 长 度 (面 积 或 体 积 )(2)几何概型应满足两个条件:试验中所有可能出现的结果(基本事件)有无限多个;每个基本事件出现的可能性相等.8.概率的性质及互斥事件的概率(1)概率的取值范围:0P (A)1.(2)必然事件的概率:P(A)1.(3)不可能事件的概率:P (A)0.(4)若 A,B 互斥,则 P(AB)P(A )P(B),特别地 P(A)P ( )1
5、.A 【易错点提醒】1.混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错2.利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者的含义:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“ 重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和3.在独立性检验中,K 2 (其中 nabcd)所给出的检验随机n(ad bc)2(a b)(a c)(b d)(c d)变量 K2 的观测值 k,并且 k 的值越大,说明“X 与 Y 有
6、关系”成立的可能性越大,可以利用数据来确定“X 与 Y 有关系”的可信程度.4.混淆直线方程 yax b 与回归直线 x 系数的含义,导致回归分析中致误.y b a 5.应用互斥事件的概率加法公式,一定要注意确定各事件是否彼此互斥,并且注意对立事件是互斥事件的特殊情况,但互斥事件不一定是对立事件, “互斥”是“对立”的必要不充分条件.6.几何概型的概率计算中,几何“测度”确定不准而导致计算错误7.求古典概型的概率的关键是正确列举出基本事件的总数和待求事件包含的基本事件数,两点注意:(1)对于较复杂的题目,列出事件数时要正确分类,分类时应不重不漏.(2)当直接求解有困难时,可考虑求其对立事件的概
7、率.8利用古典概型计算事件 A 的概率应注意的问题: 本试验是否是等可能的;本试验的基本事件有多少个;事件 A 是什么,它包含的基本事件有多少个,回答好这三个方面的问题,解题才不会出错.【主题考向】考向一 抽样方法与总体估计【解决法宝】1.分层抽样的本质是按比例确定每层抽取个体的个数。2.解决总体分布估计问题,若利用频率分布直方图求众数,即最高的小长方形底边中点的横坐标即是众数;若利用频率分布直方图求为中位数,即利用中位数左边和右边的小长方形的面积和是相等的求解;若为利用频率分布直方图求平均数,即为频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和;若为估计某个范围上的概率或频
8、数,根据频率分布直方图求出该范围上所有频率之和即为概率,频率乘以样本容量即为频数.3.给出样本的茎叶图,出现次数最多的样本数据即为众数,数据从小到大排成一列,若中间为一个数,该数为中位数,若中间为两个数,则中间两个数的平均值为中位数,均值和方差利用均值和方差公式计算出样本的均值和方差即为总体的均值与方差.例 1 【河南省郑州市 2018 年二质测】某市举行了一次初一学生调研考试,为了解本次考试学生的数学学科成绩情况,从中抽取部分学生的分数(满分为 100 分,得分取正整数,抽取学生的分数均在 之501,内)作为样本(样本容量 )进行统计,按照 的分组方法作n50,6,70,8,9,出频率分布直
9、方图,并作出了样本分数的茎叶图(茎叶图中仅列出了得分在 的数据.5608()求频率分布直方图中的 的值,并估计学生分数的中位数;,xy()字在选取的样本中,从成绩在 80 分以上(含 80 分)的学生中随机抽取 2 名学生,求所抽取的 2 名学生中恰有一人得分在 内的概率.901,【分析】()由题意可知,样本容量 , ,再根据中位数的定义得到 ;()根据50n.10y 71a古典概型的计算公式得到:总的事件个数为 10 件,满足情况的有 2 件,故得到概率为 .02【解析】()由题意可知,样本容量 , ,80.1650.1y0.1.40.1.34x因为 所以学生分数的中位数在 内,63657,
10、8设中位数为 , 得 .a0.0.5a1a考向二 几何概型【解决法宝】1.当构成试验的结果的区域为长度、面积、体积、弧长、夹角等时,应考虑使用几何概型求解;2.利用几何概型求概率时,关键是构成试验的全部结果的区域和事件发生的区域的寻找,有时需要设出变量,在坐标系中表示所需要的区域.例 2 【福建省三明市二中 2018 届二模】设关于 的一元二次方程 x220xab(1)若 从 , , , 四个数中任取的一个数, 是从 , , 三个数中任取的一个数,求上a0123b01述方程有实根的概率;(2)若 是从区间 上任取的一个数, 是从区间 上任取的一个数,求上述方程有实根的概, ,2率【分析】(1)
11、所有基本事件为从 , , , 四个数中任取的一个数, 是从 , , 三个数中任0123b012取的一个数;所求事件为方程有实根 ,即 ,分别列举出 的组合,根据古典概型计算概率;(2)2aba所有基本事件为 从区间 上任取的一个数, 是从区间 上任取的一个数,所求事件为方程有a,302实根, 即 ,分别列出不等式画出区域,根据几何概型求出概率.2b【解析】若方程 有实根,则 ,即 20x24ab2ab(1)设“方程 有实根”为事件 ,2aA 从 四个数中任取的一个数, 是从 三个数中任取的一个数,a0,3b0,1记 为所取两数的一个组合,则所有可能的取法有: , , , , , b ,0,1(
12、0,2) 1,, , , , , , 共 12 种且每种均等可能被抽到,其中满足1,2,2,1,3,32条件 的有 , , , , , , , , 共 9 种,2a01201,3,3, 学= 科网93124PA(2)设“方程 有实根”为事件 ,20xabB 从区间 上任取的一个数, 是从区间 上任取的一个数,a0, 0,2记 为所取两数的一个组合,则 , ,b3ab点 所在的区域为如图所示的矩形,,又条件 可化为 ,即 ,2aba0b满足条件 的点 所在的区域为如图所示的阴影部分区域0, 1326OABDCSP梯 形矩 形考向三 回归分析【解决法宝】回归分析问题的处理步骤:先画出散点图,利用散
13、点图判定两个变量是否先线性相关,若不线性相关,根据散点图选择合适的拟合函数,然后对拟合函数进行变换,化为线性相关问题;第二步,若样本数据较小,选第二个公式求 ,若样本数据较大但与样本均值差较小用第 1 个公式求 ,再利用回归b b直线过样本中心点求 ,得到回归直线方程;第三步,利用回归方程进行预测或对回归模型进行回归分a析例 3 【湖北省荆州中学等“四地七校 2018 届 2 月联考】已知鸡的产蛋量与鸡舍的温度有关,为了确定下一个时段鸡舍的控制温度,某企业需要了解鸡舍的温度 (单位 ) ,对某种鸡的时段产蛋量 (单位: xC y)和时段投入成本 (单位:万元)的影响,为此,该企业收集了 7 个
14、鸡舍的时段控制温度 和产蛋量tz ix的数据,对数据初步处理后得到了如图所示的散点图和表中的统计量的值.1,27iy其中 , .lniiky71ik(1)根据散点图判断, 与 哪一个更适宜作为该种鸡的时段产蛋量 关于鸡舍时段控ybxa21cxye y制温度 的回归方程类型?(给判断即可,不必说明理由)x(2)若用 作为回归方程模型,根据表中数据,建立 关于 的回归方程;21cxye yx(3)已知时段投入成本 与 的关系为 ,当时段控制温度为 时,鸡的时段产z,y2.501ze28蛋量及时段投入成本的预报值分别是多少?附: 对于一组具有线性相关关系的数据 ,其回归直线 的斜率和截距,3,i n
15、 =u的最小二乘估计分别为 , 12=niiiiiu=u【分析】 (1)由散点图可作出判断;(2)由 得 ,令 , , 21cxyCe21lnlyClnyk2=C,由图表中的数据可知 , ,从而得到 关于 的回归方程;(3)根据回归=lnC35=1403=4x直线方程得到 时, , .28x.y82z【解析】 (1) 适宜1cxye(2)由 得2C21lnlC令 , , lnyk2=由图表中的数据可知 , 351403=4 134kx 关于 的回归方程为y344.7xxye(3) 时,由回归方程得 , 28x=0196.3=5.40.851.42048.32z即鸡舍的温度为 时,鸡的时段产量的
16、预报值为 515.4,投入成本的预报值为 48.432.考向四 独立性检验【解题法宝】对独立性检验问题,根据条件列出 22 列联表,根据实际问题需要的可信度确定临界值 ;利用公式 = ,由观测数据计算得到随机变量 的观测值 ;如果0k2K2()(nadbc2Kk ,就以 的把握认为“ 与 有关系”;否则就说样本观测值没有提供“ 与k020(1)1%PkXYX有关系”的充分证据.Y例 4 【云南省保山市 2018 届二统测】某校进行文科、理科数学成绩对比,某次考试后,各随机抽取 100名同学的数学考试成绩进行统计,其频率分布表如下.()根据数学成绩的频率分布表,求理科数学成绩的中位数的估计值;(
17、精确到 0.01)()请填写下面的列联表,并根据列联表判断是否有 90%的把握认为数学成绩与文理科有关:参考公式与临界值表: 22nadbcKd20PKk0.100 0.050 0.025 0.010 0.00102.706 3.841 5.024 6.635 10.828【分析】 ()中位数两边的概率值相等均为 0.5,由此可得解;()根据数学成绩的频率分布表可完成列联表,根据题中公式计算 ,查表下结论即可.2K【解析】 ()文科数学成绩的频率分布表中,成绩小于 105 分的频率为 0.410.5,故文科数学成绩的中位数的估计值为 分 150.4108.6537()根据数学成绩的频率分布表得
18、如下列联表:数学成绩 分120数学成绩 分120合计理科 25 75 100文科 22 78 100合计 47 153 200,2205780.5.761413K故没有 90%的把握认为数学成绩与文理科有关 考向五 古典概型【解题法宝】1.求古典概型的概率的关键是正确列举出基本事件的总数和待求事件包含的基本事件数.2基本事件数的探求方法:列举法:适合于较简单的试验;树状图法:适合于较为复杂的问题中的基本事件的探求列表法:适用于多元素基本事件的求解问题,通过列表把复杂的题目简单化、抽象的题目具体化例 5 【湖南省郴州市 2018 届二质检】寒冷的冬天,某高中一组学生来到一大棚蔬菜基地,研究种子发
19、芽与温度控制技术的关系,他们分别记录五组平均温度及种子的发芽数,得到如下数据:平均温度 (x)C11 10 13 9 12发芽数 (颗)y25 23 30 16 26()若从五组数据中选取两组数据,求这两组数据平均温度相差不超过 概率;2C()求 关于 的线性回归方程 ;yxybxa()若由线性回归方程得到的估计数据与实际数据的误差不超过 2 颗,则认为得到的线性回归方程是可靠的,试问()屮所得的线性回归方程是否可靠?(注: , )1122nni iiiiiixyxybaybx【分析】 ()利用列举法可得五组数据中选取两组数据总事件数为 ,两组数据平均温度相差不超过10的事件数为 ,由古典概型
20、概率公式可得结果;()根据表格中的数据及平均数公式可求出 与2C7 x的值可得样本中心点的坐标,从而求可得公式 中所需数据,求出 的值,再结合y 12niixybb样本中心点的性质可得 的值,进而可得 关于 的回归方程;()将表格中所给 的值代入回归方程,ayxx求出的 值与表格中对应 值比较即可的结果.yy【解析】 ()设 ,则基本事件为 , 2A C 从 五 组 数 据 中 选 取 两 组 数 据 平 均 温 度 相 差 不 超 过, , , , , , , , , 10, ,139, 12, 013, 9, 10, 39, 12,所以92, 70P() , 215x5624y511396
21、213iy522219015ix413y2605x5125031.6iixyb43.1.ayx关于 的线性回归方程 01yx()利用回归方程 得到五组估计数据如图平均温度 11 10 13 9 12xC发芽数 (颗)y25 23 30 16 26估计发芽数 24 21 30 18 27所以线性回归方程 是可靠的.3.10yx【主题集训】1.【江西省上饶市 2018 届二模】上饶某购物中心在开业之后,为了解消费者购物金额的分布,在当月的电脑消费小票中随机抽取 张进行统计,将结果分成 5 组,分别是n,制成如图所示的频率分布直方图(假设消费金0,2,40,60,8,10额均在 元的区间内) 1(1
22、)若在消费金额为 元区间内按分层抽样抽取 6 张电脑小票,再从中任选 2 张,求这 2 张小票均0,4来自 元区间的概率;0,2(2)为做好五一劳动节期间的商场促销活动,策划人员设计了两种不同的促销方案:方案一:全场商品打 8.5 折;方案二:全场购物满 200 元减 20 元,满 400 元减 50 元,满 600 元减 80 元,满 800 元减 120 元,以上减免只取最高优惠,不重复减免利用直方图的信息分析哪种方案优惠力度更大,并说明理由(直方图中每个小组取中间值作为该组数据的替代值) 【解析】 (1)由图可知, 中抽取 2 张,设为 , 中抽取 4 张,设为 ,0, ,ab20, ,
23、ABCD共有 15 个基本事件: ,其中 2 张小票均来,abABCaDbABCD自 的基本事件为 ,所以 ;0,215P(2)方案一: 元. .8510.30.2.470.290.145方案二:,所以方案二优惠力度更大.1024.6.8.1元 582. 【山西省 2018 届一模】某快递公司收取快递费用的标准是:重量不超过 的包裹收费 10 元;重量超过 的包裹,除 收费 10 元之外,超过 的部分,每超出 (不足 ,按 计算)需再收 5 元.该公司对近 60 天,每天揽件数量统计如下表:(1)某人打算将 三件礼物随机分成两个包裹寄出,求该人支付的快递费不超过(0.3),(1.8),(1.5
24、)30 元的概率;(2)该公司从收取的每件快递的费用中抽取 5 元作为前台工作人员的工资和公司利润,剩余的作为其他费用.前台工作人员每人每天揽件不超过 150 件,工资 100 元,目前前台有工作人员 3 人,那么,公司将前台工作人员裁员 1 人对提高公司利润是否更有利?【解析】 (1)由题意,寄出方式有以下三种可能:所有 3 种可能中,有 1 种可能快递费未超过 30 元,根据古典概型概率计算公式,所示概率为 ;13(2)将题目中的天数转化为频率,得若不裁员,则每天可揽件的上限为 450 件,公司每日揽件数情况如下:故公司平均每日利润的期望值为 (元) ;若裁员 1 人,则每天可揽件的上限为
25、 300 件,公司每日揽件数情况如下:故公司平均每日利润的期望值为 (元)23552100=975故公司将前台工作人员裁员 1 人对提高公司利润不利.3.【天津市十二重点中学 2018 年联考】为进一步贯彻落实“十九”大精神,某高校组织了“歌颂祖国,紧跟党走”为主题的党史知识竞赛,从参加竞赛的学生中,随机抽取 40 名学生,将其成绩分为六段, , ,得到如图所示的频率分布直方图.70,75),75,80) 90,95),95,100(1)求图中 的值;(2)若从竞赛成绩在 与 两个分数段的学生 中随机选取两名学生,设这两名学生的竞赛成绩之差的绝对值不大于 分为事件 ,求事件发生的概率.【解析】
26、 (1)由于图中所有小矩形的面积之和等于 1,所以 , 解得 . (2)成绩在 分数段内的人数为 人,分别记为 , 400.05=2成绩在 分数段内的人数为 人,分别记为 ,在两个分数段内随机选取两名学生,所有的基本事件为:,共 15 种. 事件 包含的基本事件有: 共 7 种.事件 发生的概率为 . 4. 【广西桂林、贺州、崇左三市 2018 届二联考】某地区积极发展电商,通过近些年工作的开展在新农村建设和扶贫过程中起到了非常重要的作用,促进了农民生活富裕,为了更好地了解本地区某一特色产品的宣传费 (千元)对销量 (千件) 的影响,统计了近六年的数据如下:xy(1)若近 6 年的宣传费 与销
27、量 呈线性分布,由前 5 年数据求线性回归直线方程,并写出 的预测值;xy y(2)若利润与宣传费的比值不低于 20 的年份称为“吉祥年”,在这 6 个年份中任意选 2 个年份,求这 2 个年份均为“吉祥年” 的概率附:回归方程 的斜率与截距的最小二乘法估计分别为 ,ybxa 12niixyb,其中 , 为 , 的平均数.aiiy【解析】 (1)由前 5 年数据可得:, ,2468x3046507,51305813iy52 214641,50,5ixxyx52138026.5iiyxb506.17.5aybx回归直线方程为 ,将 代入得yx0 的预测值为 82.5.y(2)从 6 个年份中任取
28、 2 个年份的情况为: , , 2,407, 24051, , , , , , , 409, , , 40816, , , 15, , , 51, , , 769, , , , , , 781, , , 7205, , , 69, , , 8, , , , , ,共 15 种. 525, , , 9, , , 9,20, , 802, , ,2 个年份均为“吉祥年” 的情况有: , , , 41, , , 41, , , 40125, , , , ,共 6 种.1086, , , 1025, , , 865, , ,6 个年份中任意选个 2 个年份均为“吉祥年”的概率为 .215.【江西省临川
29、一中等九校 2018 届联考】进入高三,同学们的学习越来越紧张,学生休息和锻炼的时间也减少了.学校为了提高学生的学习效率,鼓励学生加强体育锻炼.某中学高三(3)班有学生 50 人.现调查该班学生每周平均体育锻炼时间的情况,得到如下频率分布直方图.其中数据的分组区间为: 0,24,6,810,2(1)求学生周平均体育锻炼时间的中位数(保留 3 位有效数字) ;(2)从每周平均体育锻炼时间在 的学生中,随机抽取 2 人进行调查,求此 2 人的每周平均体育锻0,4炼时间都超过 2 小时的概率;(3)现全班学生中有 40是女生,其中 3 个女生的每周平均体育锻炼时间不超过 4 小时.若每周平均体育锻炼
30、时间超过 4 小时称为经常锻炼,问:有没有 90的把握说明,经常锻炼与否与性别有关?附: 22nadbcKdP(K2k0) 0.100 0.050 0.010 0.001k0 2.706 3.841 6.635 10.828【解析】 (1)设中位数为 a,因为前三组的频率和为:(0.02+0.03+0.11)2=0.320.5,第四组的频率为:0.142=0.28,所以(a-6)0.14=0.5-0.32, a=517.29学生周平均体育锻炼时间的中位数是 7.29(3)由已知可知,不超过 4 小时的人数为:500.052=5 人,其中女生有 3 人,所以男生有 2 人,因此经常锻炼的女生有
31、5040-3=17 人,男生有 30-2=28 人所以 22 列联表为:男生 女生 小计经常锻炼 28 17 45不经常锻炼 2 3 5小计 30 20 50所以所以没有 90的把握说明,经常锻炼与否与性别有关.6.【河北省衡水中学 2018 届十模】一只药用昆虫的产卵数 与一定范围内的温度 有关,现收集了该种yx药用昆虫的 组观测数据如下表:6温度 /xC2132472932产卵数 /y个6057经计算得: , , , , 612ix613iy6157iiixy62184iix,线性回归模型的残差平方和 , ,其中 , 621390iiy6213.46iiy 8.0653ei分别为观测数据中
32、的温差和产卵数, .i ,2345,i(1)若用线性回归方程,求 关于 的回归方程 (精确到 ) ;yxybxa0.1(2)若用非线性回归模型求得 关于 回归方程为 ,且相关指数 236xe2095R(i)试与(1)中的回归模型相比,用 说明哪种模型的拟合效果更好.2R(ii)用拟合效果好的模型预测温度为 时该种药用昆虫的产卵数(结果取整数) .35C附:一组数据 , , ,其回归直线 的斜率和截距的最小二乘估计1,xy2,y,nxyybxa为 , ;相关指数21niiiiibab221niiiiR【解析】 (1)由题意得, ,12niiiiixy576.84 ,36.283.6a 关于 的线
33、性回归方程为 .yx.3861yx(2) (i)由所给数据求得的线性回归方程为 ,相关指数为3861.yx.21niiiiyR.41390.209因为 ,0.938.5所以回归方程 比线性回归方程 拟合效果更好.0.236xye6.381yx(ii)由(i)得当温度 时, .C0.25e065e又 , (个).8.065317e0.631790y即当温度 时,该种药用昆虫的产卵数估计为 个.xC 17.【四川省凉山州 2018 届二诊】为了解男性家长和女性家长对高中学生成人礼仪式的接受程度,某中学团委以问卷形式调查了 位家长,得到如下统计表:50男性家长 女性家长 合计赞成 121426无所谓
34、 864合计 302050(1)据此样本,能否有 的把握认为“接受程度”与家长性别有关?说明理由;9%(2)学校决定从男性家长中按分层抽样方法选出 人参加今年的高中学生成人礼仪式,并从中选 人交流5 2发言,求发言人中至多一人持“赞成”态度的概率参考数据 2Pxk0.50.13.8416.35参考公式 22nadbcxd【解析】 (1)由题: , , , ,1418c6d ,所以,没有 的把握认为“ 接受程度”与家长性别有关.2250648.376.530x9%(2)选出的 人中持“赞成”态度的人数为: (人)1230持“无所谓”态度的人数为: (人)设持“赞成”态度的恩分别为 , ;持“ 无
35、所谓”态度的人分别为 , , 1a2 1b23基本事件总数为: , , , , , , , 12a, 1b, 12a, 13b, 21a, 2b, 23a, 共 种.12b, 3b, 3, 0其中至多一人持“赞成” 态度的有: 种9 .90p8.【山东省聊城市 2018 届高三一模】为促进农业发展,加快农村建设,某地政府扶持兴建了一批“超级蔬菜大棚”.为了解大棚的面积与年利润之间的关系,随机抽取了其中的 7 个大棚,并对当年的利润进行统计整理后得到了如下数据对比表:大棚面积(亩) x4.5 5.0 5.5 6.0 6.5 7.0 7.5年利润(万元) y6 7 7.4 8.1 8.9 9.6
36、11.1由所给数据的散点图可以看出,各样本点都分布在一条直线附近,并且 与 有很强的线性相关关系.yx()求 关于 的线性回归方程;学科网yx()小明家的“超级蔬菜大棚”面积为 8.0 亩,估计小明家的大棚当年的利润为多少;()另外调查了近 5 年的不同蔬菜亩平均利润(单位:万元) ,其中无丝豆为:1.5,1.7,2.1,2.2,2.5;彩椒为:1.8,1.9,1.9,2.2,2.2,请分析种植哪种蔬菜比较好?参考数据: , .7139.6ixy721iix参考公式: , .21niiiybxab【解析】 () , , ,68.3748.6x,712iiixyb591.5,a8.3716.2那
37、么回归方程为: 5yx()将 代入方程得8.0x,即小明家的“超级大棚”当年的利润大约为 11.442 万元.1.57126.4y9.【河北邯郸市 2017 届高三 9 月联考,18】某中学为了了解全校学生的上网情况,在全校采用随机抽样的方法抽取了 40 名学生(其中男女生人数恰好各占一半)进行问卷调查,并进行了统计,按男女分为两组,再将每组学生的月上网次数分为 5 组: , , , , ,得到如图所0,)5,10,)15,2)0,5示的频率分布直方图:()写出 的值;a()求抽取的 40 名学生中月上网次数不少于 15 次的学生人数;()在抽取的 40 名学生中,从月上网次数不少于 20 次
38、的学生中随机抽取 2 人 ,求至少抽到 1 名女生的概率.【解析】 () .1(20.3.08)55a()在所抽取的女生中,月上网次数不少于 15 次的学生频率为(0.05+0.02)5=0.35,所以,在所抽取的女生中,月上网次数不少于 15 次的学生有 0.0320=7 人.在所抽取的男生中,月上网次数不少于 15 次的学生频率为(0.04+0.03)5=0.35,所以,在所抽取的男生中,月上网次数不少于 15 次的学生有 0.0320=7 人.故抽取的 40 名学生中月上网次数不少于 15 次的学生人数有 7+7=14 人.()记“在抽取的 40 名学生中,从月上网次数不少于 20 次的
39、学生中随机抽取 2 人,至少抽到 1 名女生”为事件 ,在抽取的女生中,月上网次数不少于 20 次的学生频率为 0.025=0.1,人数为 0.120=2 人,A在抽取的男生中,月上网次数不少于 20 次的学生频率为 0.035=0.15,人数为 0.1520=3 人,记这 2 名女生为 , ,这 3 名男生为 , , ,121B23则在抽取的 40 名学生中,从月上网次数不少于 20 次的学生中随机抽取 2 人,所有可能结果有 10 种,即, , , , , , , , ,12(,)A1(,)B12(,)A13(,)21(,)A2(,)B3(,)A12(,)B13(,)23(,)B,而事件
40、包含的结果有 7 种,它们是 , , , , , ,12(,)1(,)12(,)13(,)21(,)2(,)A,23(,)AB所以 .10P10.【河北省衡水中学 2018 届七调】国内某知名大学有男生 14000 人,女生 10000 人.该校体育学院想了解本校学生的运动状况,根据性别采取分层抽样的方法从全校学生中抽取 120 人,统计他们平均每天运动的时间(已知该校学生平均每天运动的时间范围是 ) ,如下表所示.0,3h男生平均每天运动的时间分布情况:学科网女生平均每天运动的时间分布情况:(1)假设同组中的每个数据均可用该组区间的中间值代替,请根据样本估算该校男生平均每天运动的时间(结果精
41、确到 0.1). (2)若规定平均每天运动的时间不少于 的学生为“运动达人”,低于 的学生为“非运动达人”.2h2h()根据样本估算该校“运动达人”的数量;()请根据上述表格中的统计数据填写下面 列联表,并通过计算判断能否在犯错误的概率不超过0.05 的前提下认为“运动达人”与性别有关.参考公式: ,其中 .22nadbcKdnabcd参考数据:【解析】 (1)由题意得,抽取的男生人数为 (人) ,抽取的女生人数为14027(人) ,故 , .20755xy则估算该校男生平均每天运动的时间为, 12.31.782.510.7501.h所以该校男生平均每天运动的时间为 .h(2) ()样本中“运
42、动达人”所占的比例是 ,1206故估算该校“运动达人” 有 (人).1446()由统计数据得:根据上表,可得 .22105496.74381705K故不能在犯错误的概率不超过 0.05 的前提下认为“运动达人”与性别有关.11.【山东省垦利第一中学等四校 2018 届上学期期末】为研究某种图书每册的成本费 (元)与印刷数y(千册)的关系,收集了一些数据并作了初步处理,得到了下面的散点图及一些统计量的值xxyu821iix81iiixy821iiu81iiiuy15.25 3.63 0.269 2085.5 230.0.787 7.049表中 , 1iiux81iu(1)根据散点图判断: 与 哪
43、一个更适宜作为每册成本费 (元)与印刷数 (千册)yabxdycxyx的回归方程类型?(只要求给出判断,不必说明理由)(2)根据(1)的判断结果及表中数据,建立 关于 的回归方程(回归系数的结果精确到 0.01) ;(3)若每册书定价为 10 元,则至少应该印刷多少册才能使销售利润不低于 78840 元?(假设能够全部售出,结果精确到 1)(附:对于一组数据 , , ,其回归直线 的斜率和截距的最小二1,v2,nvv乘估计分别为 , )21niiiiiv(3)假设印刷 千册,依题意, ,x8.9610.27.840xx即 ,8.7. ,10x至少印刷 10 千册12.【百校联盟 2018 届
44、TOP202018 届三月联考】某蛋糕店制作并销售一款蛋糕,当天每售出 个利润为1元,未售出的每个亏损 元.根据以往 天的统计资料,得到如下需求量表,元旦这天,此蛋糕店制作5310了 个这种蛋糕.以 (单位:个, )表示这天的市场需求量. (单位:元)表示这天130x5xT售出该蛋糕的利润.需求量/个 ,10,120,130,140,150天数 10 20 30 25 15(1)将 表示为 的函数,根据上表,求利润 不少于 元的概率;TxT570(2)估计这 天的平均需求量(同一组数据用该区间的中点值作代表) ;0(3)元旦这天,该店通过微信展示打分的方式随机抽取了 名市民进行问卷调查,调查结
45、果如下表所示,已知在购买意愿强的市民中,女性的占比为 .57购买意愿强 购买意愿弱 合计女性 28男性 22合计 28 22 50完善上表,并根据上表,判断是否有 的把握认为市民是否购买这种蛋糕与性别有关?97.5%附: .22nadbcKd2Pk0.05 0.025 0.010 0.005k3.841 5.024 6.635 7.879【解析】 (1)当 时, ,0,13x53108390Txx当 时, ,所以3,5x6,1, 655.当 时, , ,又 ,所以 ,70T89057x1302x07201x因此,利润 不少于 570 元的概率为 .(2)这 100 天的平均需求量为 .5135
46、4560(3)根据题意,购买意愿强市民中女性的人数为 ,男性为 8 人,287填表如下:购买意愿强 购买意愿弱 合计女性 20 8 28男性 8 14 22合计 28 22 50根据公式, ,22501486.15.024K故有 的把握认为市民是否购买这种蛋糕与性别有关.97%13.【广东省茂名市 2018 届一测】一只药用昆虫的产卵数 y 与一定范围内的温度 x 有关, 现收集了该种药用昆虫的 6 组观测数据如下表:温度 x/C 21 23 24 27 29 32产卵数 y/个 6 11 20 27 57 77经计算得: , , , ,612ix613iy61()57iiixy62184iix,线性回归模型的残差平方和 ,e 8.06053167,其中 xi, yi 分别为621()390iiy621()36.4iiy观测数据中的温度和产卵数,i=1, 2, 3, 4, 5, 6.()若用线性回归模型,求 y 关于 x 的回归方程 = x+ (精确到 0.1) ;yba()若用非线性回归模型求得 y 关于 x 的回归方程为 =0.06e0.230