收藏 分享(赏)

高中理数讲座11.4统计案例.doc

上传人:eco 文档编号:4851925 上传时间:2019-01-16 格式:DOC 页数:23 大小:685.10KB
下载 相关 举报
高中理数讲座11.4统计案例.doc_第1页
第1页 / 共23页
高中理数讲座11.4统计案例.doc_第2页
第2页 / 共23页
高中理数讲座11.4统计案例.doc_第3页
第3页 / 共23页
高中理数讲座11.4统计案例.doc_第4页
第4页 / 共23页
高中理数讲座11.4统计案例.doc_第5页
第5页 / 共23页
点击查看更多>>
资源描述

1、114 统计案例1回归分析(1)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法(2)线性回归模型用 ybxae 表示,其中 a 和 b 为模型的未知参数, e 称为_它的均值满足E(e)_,D(e ) 2, 2 越小,精度越_(3)在具有线性相关关系的数据( x1,y 1),(x 2,y 2),(x n,y n)中,回归方程的斜率和截距的最小二乘估计公式分别为: .)(12xbyaniiiii其中 , ,称为样本点的中心.x1niy1ni(4)残差: =称为相应于点( , )的残差,残差平方和为.eixy(5)相关指数 R2=. R2 越大,说明残差平方和,即模型的拟合效果;R

2、2 越小,残差平方和,即模型的拟合效果.在线性回归模型中,R 2 表示解释变量对于预报变量变化的,R 2 越接近于 1,表示回归的效果.2.独立性检验(1)变量的不同“值”表示个体所属的不同类别,像这样的变量称为_.(2)像下表所示列出两个分类变量的频数表,称为_.假设有两个分类变量 X 和 Y,它们的可能取值分别为x 1, x2和y 1,y 2 ,其样本频数列联表(称为 22 列联表)为y1 y2 总计x1 a b a+bx2 c d c+d总计 a+c b+d a+b+c+d构造一个随机变量 K2=_,其中 n=a+b+c+d 为样本容量 .如果 K2 的观测值 kk 0,就认为“两个分类

3、变量之间有关系” ;否则就认为“两个分类变量之间没有关系”.我们称这样的 k0 为一个判断规则的临界值.按照上 述 规 则 , 把 “两 个 分 类 变 量 之 间 没 有 关 系 ”错 误 地 判 断为 “两 个 分 类 变 量 之 间 有 关 系 ”的 概 率 不 超 过 P(K 2k 0).上面这种利用随机变量 K2 来判断“两个分类变量有关系”的方法称为_.自查自纠1. (2) 随机误差 0 高 (3)( , )(4) xyiiniy12)(5)1 越小 越好 越大 越差贡献率 越好niiiiiy12)(2(1)分类变量(2)列联表n(ad bc)2(a b)(c d)(a c)(b

4、d)独立性检验在回归分析中,代表了数据点和它在回归直线上相应位置差异的是( )A总偏差平方和 B残差平方和C回归平方和 D相关指数 R2解:残差平方和描述了数据点和它在回归直线上相应位置的差异,故选 B.设两个变量 x 和 y 之间具有线性相关关系,它们的相关系数是 r,y 关于 x 的回归直线的回归系数为 ,回b 归截距是 ,那么必有( )a A. 与 r 的符号相同 B. 与 r 的符号相同b a C. 与 r 的符号相反 D. 与 r 的符号相反b a 解:根据 和 r 的定义公式可知 A 正确,故选 A.b 对四组数据进行统计,获得以下散点图,关于其相关系数比较,正确的是( )Ar 2

5、7.879,在犯错误的概率不超过 0.005 的前提下,认为课外阅读量大与作文成绩优秀有关,即有 99.5%的把握认为课外阅读量大与作文成绩优秀有关 故选 D.类型四 独立性检验(江西 2018 届红色七校第一次联考 )某市调研考试后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于 120 分为优秀,120 分以下为非优秀,统计成绩后,得到如下的列联表,且已知在甲、乙两个文科班全部 110 人中随机抽取 1 人为优秀的概率为 .311优秀 非优秀 总计甲班 10乙班 30总计 110(1)请完成上面的列联表;(2)根据列联表的数据,若按 99.9%的可靠性要求,能否认为“成绩与

6、班级有关系” ;(3)若按下面的方法从甲班优秀的学生中抽取一人,把甲班优秀的 10 名学生从 2 至 11 进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号,试求抽到 9 号或 10 号的概率参考方式与临界值表K2 .n(ad bc)2(a b)(c d)(a c)(b d)P(K2k 0) 0.100 0.050 0.025 0.010 0.001k0 2.706 3.841 5.024 6.635 10.828解:(1)列联表如下:优秀 非优秀 总计甲班 10 50 60乙班 20 30 50总计 30 80 110(2)假设成绩与班级无关,则K2n(ad bc)2(a

7、 b)(c d)(a c)(b d) 7.56.635,因此在犯错误的概率不超过 0.01 的前提下认为“40 岁以上的人患胃病与否和生活规律有关” 1线性回归分析的方法、步骤(1)画出两个变量的散点图;(2)求相关系数 r,并确定两个变量的相关程度的高低;(3)用最小二乘法求回归直线方程 x ,y b a . ,)(1212xbyanyxiniiniiiii(4)利用回归直线方程进行预报注:对于非线性(可线性化 )的回归分析,一般是利用条件及我们熟识的函数模型,将题目中的非线性关系转化为线性关系进行分析,最后还原利用相关指数 R21 刻画回归效果时,R 2 越大,意niiiiiy12)(味着

8、残差平方和 越小,模型的拟合效果越好niiiy12)(2独立性检验的一般步骤(1)假设两个分类变量 x 与 y 没有关系;(2)计算出 K2 的观测值,其中K2 ;n(ad bc)2(a b)(c d)(a c)(b d)(3)把 K2 的值与临界值比较,作出合理的判断3独立性检验的注意事项(1)在列联表中注意事件的对应及相关值的确定,不可混淆(2)在实际问题中,独立性检验的结论仅是一种数学关系表述,得到的结论有一定的概率出错(3)对判断结果进行描述时,注意对象的选取要准确无误,应是对假设结论进行的含概率的判断,而非其他1一位母亲记录了儿子 39 岁的身高,由此建立的身高 y(单位:cm)与年

9、龄 x(单位:岁)的回归方程为7.19x73.93.用这个方程预测这个孩子 10 岁时的身高,则正确的叙述是( )y A身高一定是 145.83 cm B身高在 145.83 cm 以上C身高在 145.83 cm 以下D身高在 145.83 cm 左右解:回归模型的预报值是一种估计值,故选 D.2(2015福建月考)甲、乙、丙、丁四位同学各自对 A,B 两变量的线性相关性做试验,并由回归分析法分别求得相关指数 R2 与残差平方和 m 如下表:甲 乙 丙 丁R2 0.85 0.78 0.69 0.82m 103 106 124 115则哪位同学的试验结果体现 A,B 两变量更强的线性相关性(

10、)A甲 B乙 C丙 D丁解:因为相关指数 R2 越大,残差平方和 m 越小,拟合效果越好故选 A.3在用线性回归方程研究四组数据的拟合效果中,分别作出下列四个关于四组数据的残差图,则用线性回归模型拟合效果最佳的是( )A BC D解:残差分析时,点分布在比较狭窄的区域,说明模拟效果比较好故选 C.4为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了 100 位居民进行调查,经过计算K20.99 ,根据这一数据分析,下列说法正确的是 ( )A有 99%的人认为该电视栏目优秀B有 99%的人认为该电视栏目是否优秀与改革有关系C有 99%的把握认为该电视栏目是否优秀与改革有关系D没有理由认

11、为该电视栏目是否优秀与改革有关系解:只有 K26.635 才能有 99%的把握认为该电视栏目是否优秀与改革有关系,而即使 K26.635 也只是对“该电视栏目是否优秀与改革有关系”这个论断成立的可能性大小的结论,与是否有 99%的人等无关故只有 D 正确故选 D.5某种产品的广告费支出 x 与销售额 y(单位:万元)之间有下表关系x 2 4 5 6 8y 30 40 60 50 70y 与 x 的线性回归方程为 6.5x 17.5,当广告支出 5 万元时,残差为 ( )y A10 B20 C 30 D40解:因为 y 与 x 的线性回归方程为 6.5x17.5,当 x 5 时, 50,当广告支

12、出 5 万元时,由表格得:y y y60,残差为 605010,故选 A.6变量 X 与 Y 相对应的一组数据为(10 ,1),(11.3,2) ,(11.8,3) ,(12.5,4),(13 ,5);变量 U 与 V 相对应的一组数据为(10,5),(11.3,4) ,(11.8,3),(12.5 ,2), (13,1)r 1 表示变量 Y 与 X 之间的线性相关系数,r2 表示变量 V 与 U 之间的线性相关系数,则( )Ar 20,V 与 U 负相关,相关系数 r27.879,55(2020 105)230252530所以有 99.5%的把握认为喜欢 “应用统计”课程与性别有关(2)设所

13、抽样本中有 m 个男生,则 ,得 m4,所以样本中有 4 个男生,2 个女生从中任选 2 人有630 m20C 15 种情形,其中恰有 1 个男生和 1 个女生的有 C C 8 种情形,所求概率 P .26 14 1281511(2017全国卷)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了 100个网箱,测量各箱水产品的产量(单位:kg) ,其频率分布直方图如下:(1)记 A 表示事件 “旧养殖法的箱产量低于 50 kg”,估计 A 的概率;(2)填写下面列联表,并根据列联表判断是否有 99%的把握认为箱产量与养殖方法有关;箱产量6.635,故有 99%的把握认为箱

14、产量与养殖方法有关(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值( 或中位数)在 50kg 到 55kg 之间,旧养殖法的箱产量平均值(或中位数)在 45kg 到 50kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,新养殖法优于旧养殖法(2016武汉市武昌区高三元月调研 )某城市随机抽取一年内 100 天的空气质量指数(AQI) 的监测数据,结果统计如下:AQI 0,50 (50,100 (100,150 (150,200 (200,300 300空气质量 优 良 轻度污染 中度污染 重度污染 严重污染天数 6 1

15、4 18 27 20 15(1)若本次抽取的样本数据有 30 天是在供暖季,其中有 8 天为严重污染根据提供的统计数据,完成下面的22 列联表,并判断是否有 95%的把握认为“该城市本年的空气严重污染与供暖有关 ”?非严重污染 严重污染 总计供暖季非供暖季总计 100(2)已知某企业本年内每天的经济损失 y(单位:元)与空气质量指数 x 的关系式为 y试估计该企业本年内一个月 (按 30 天计算) 的经济损失的数学期望0, 0 x 100,400, 100300. )附:K 2 ,na bcd.n(ad bc)2(a b)(c d)(a c)(b d)P(K2k 0) 0.100 0.050

16、0.025 0.010 0.001k0 2.706 3.841 5.024 6.635 10.828解:(1)根据题设中的数据得到如下 22 列联表:非严重污染 严重污染 总计供暖季 22 8 30非供暖季 63 7 70总计 85 15 100将 22 列联表中的数据代入公式计算,得 K2 的观测值 k 4.575.100(227 638)285153070因为 4.5753.841,所以有 95%的把握认为“该城市本年的空气严重污染与供暖有关” (2)任选一天,设该天的经济损失为 X 元,则P(X0)P(0x100) ,P(X400)P(100300) ,15100 320所以 E(X)0

17、 400 2 000 560.15 1320 320故该企业本年内一个月的经济损失的数学期望为 30E(X)16 800(元)一、选择题:本题共 12 小题,每小题 5 分,共 60 分在每小题给出的四个选项中,只有一项是符合题目要求的1现要完成下列 3 项抽样调查:从 10 盒酸奶中抽取 3 盒进行食品卫生检查科技报告厅有 32 排,每排有 40 个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,需要请 32 名听众进行座谈东方中学共有 160 名教职工,其中一般教师 120 名,行政人员 16 名,后勤人员 24 名为了解教职工对学校在校务公开方面的意见,拟抽取一个容量为 2

18、0 的样本较为合理的抽样方法是( )A简单随机抽样;系统抽样; 分层抽样B简单随机抽样;分层抽样; 系统抽样C系统抽样;简单随机抽样; 分层抽样D分层抽样;系统抽样; 简单随机抽样解:由各抽样方法的适用范围可知较为合理的抽样方法是:用简单随机抽样,用系统抽样,用分层抽样故选 A.2某防疫站对学生进行身体健康调查,欲采用分层抽样的方法抽取样本某中学共有学生 2 000 名,抽取了一个容量为 200 的样本,已知样本中女生比男生少 6 人,则该校共有女生( )A1 030 人 B97 人C950 人 D970 人解:由题意可知抽样比为 ,2002 000 110设样本中女生有 x 人,则 x(x6

19、)200,所以 x97,该校共有女生 970 人故选 D.971103若某校高一年级 8 个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A91.5 和 91.5 B91.5 和 92C91 和 91.5 D92 和 92解:中位数是 91.5,91 922平均数 x90 91.5. 3 1 1 2 3 4 68故选 A.4(2017南昌二模)如图所示是一样本的频率分布直方图若样本容量为 100,则样本数据在15,20)内的频数是( )A20 B50 C30 D70解:因为15,20)对应的小矩形的面积为 10.0450.1 50.3,所以样本落在15,20)的频数为

20、0.310030,故选 C.5PM2.5 是指大气中直径小于或等于 2.5 微米的颗粒物,也称为可入肺颗粒物根据某地某日早 7 点到晚 8点甲、乙两个 PM2.5 监测点统计的数据( 单位:毫克/ 立方米)列出的茎叶图如图所示,则甲、乙两地 PM2.5 的方差较小的是( )A甲 B乙C甲、乙相等 D无法确定解:从茎叶图上可以观察到:甲监测点的样本数据比乙监测点的样本数据更加集中,因此甲地 PM2.5 的方差较小故选 A.6(2016成都第二次诊断)某校高三 (1)班在某次单元测试中,每位同学的考试分数都在区间100,128 内,将该班所有同学的考试分数分为七个组:100,104) ,104,1

21、08),108 ,112),112,116),116 ,120),120,124) ,124,128,绘制出频率分布直方图如图所示,已知分数低于 112 分的有 18 人,则分数不低于120 分的人数为( )A10 B12 C20 D40解:分数低于 112 分的人对应的频率/组距为 0.09,分数不低于 120 分的人对应的频率/ 组距为 0.05,故其人数为 0.0510(人)故选 A.180.097为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了 500 位老人,结果如表:性别 是否需要志愿者 男 女需要 40 30不需要 160 270附:K 2n(ad bc

22、)2(a b)(c d)(a c)(b d)P(K2k 0) 0.050 0.010 0.001k0 3.841 6.635 10.828则( )A在犯错误的概率不超过 0.1%的前提下,认为“需要志愿者提供帮助与性别有关 ”B在犯错误的概率不超过 0.1%的前提下,认为“需要志愿者提供帮助与性别无关”C有 99%以上的把握认为“需要志愿者提供帮助与性别有关”D有 99%以上的把握认为“需要志愿者提供帮助与性别无关 ”解:由于 K2 9.9676.635,所以有 99%的把握认为该地区的老年人是否500(40270 16030)220030070430需要帮助与性别有关故选 C.8(2016离

23、石区一模)为了确定加工零件所花费的时间,进行了 5 次试验,得到 5 组数据(x 1,y 1),(x 2,y 2),(x3,y 3),(x 4,y 4),(x 5,y 5),根据收集到的数据可知 x20 ,由最小二乘法求得回归直线方程 0.6x48,y 则 y1y 2y 3y 4y 5( )A60 B120 C 150 D300解:将20 代入回归直线方程得0.6204860.所以 y1y 2y 3y 4y 55300.故选 D.9(2017湖北七市(州)联合考试)广告投入对商品的销售额有较大影响某电商对连续 5 个年度的广告费和销售额进行统计,得到统计数据如下表(单位:万元) :广告费 x

24、2 3 4 5 6销售额 y 29 41 50 59 71由上表可得回归方程为 10.2x ,根据模型,预测广告费为 10 万元时的销售额约为( )y a A101.2 万元 B108.8 万元C111.2 万元 D118.2 万元解:由表中数据可得4,50,代入线性回归方程得 5010.24 ,解得 9.2,则回归方程为a a 10.2 x9.2,当 x10 时, 1029.2111.2,故选 C.y y 10在某次测量中得到的 A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若 B 样本数据恰好是A 样本数据每个都加 2 后所得数据,则 A,B 两样本的下列数

25、字特征对应相同的是( )A众数 B平均数C中位数 D标准差解:样本数据每个都加 2 后所得数据的波动情况并没有发生改变,所以标准差不变故选 D.11甲、乙两人在一次射击比赛中各射靶 5 次,两人成绩的条形统计图如图所示,则下列说法正确的是( )A甲的成绩的平均数小于乙的成绩的平均数B甲的成绩的中位数等于乙的成绩的中位数C甲的成绩的方差小于乙的成绩的方差D甲的成绩的极差小于乙的成绩的极差解:由题意可知,甲的成绩为 4,5,6,7,8,乙的成绩为 5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为 6,5,B 错;甲、乙的成绩的方差分别为 s (46) 2(56

26、)21152(66) 2(76) 2(86) 22,s (56) 2(5 6) 2( 56) 2(66) 2(96) 2 ,C 正确;甲、215 125乙的成绩的极差均为 4,D 错故选 C.12(2017江西赣州高三摸底考试) 二战中盟军为了知道德国“虎式”重型坦克的数量,采用了两种方法:一种是传统的情报窃取,一种是用统计学的方法进行估计统计学的方法最后被证实比传统的情报收集更精确德国人在生产坦克时把坦克从 1 开始进行了连续编号,在战争期间盟军把缴获的“虎式”坦克的编号进行记录,并计算出这些编号的平均值为 675.5.假设缴获的坦克代表了所有坦克的一个随机样本,则利用你所学过的统计知识估计

27、德国共制造“虎式”坦克大约有( )A1 050 辆 B1 350 辆C1 650 辆 D1 950 辆解:由题意,得 675.5,解得 n1 350,故选 B.1 2 nn二、填空题:本题共 4 小题,每小题 5 分,共 20 分13用系统抽样法从 160 名学生中抽取容量为 20 的样本,将 160 名学生从 1160 编号,按编号顺序平均分成 20 组(18 号,916 号,153160 号) ,若第 16 组抽出的号码为 123,则第 2 组中抽出的号码是_解:第 2 组中抽出的号码为 12314811.故填 11.14(2016桂林期末)为了判断高中三年级学生是否选修文科与性别的关系,

28、现随机抽取 50 名学生,得到如下22 列联表:理科 文科男 13 10女 7 20已知 P(K23.841)0.05,P (K25.024) 0.025.根据表中数据,得 K2 4.844.50(1320 107)223272030则认为选修文科与性别有关系出错的可能性为_解:因为根据表中数据得到 K24.8443.841,所以认为选修文科与性别有关系出错的可能性为 5%.故填 5%.15(2015江苏模拟)某中学为了解学生数学课程的学习情况,在 3 000 名学生中随机抽取 200 名,并统计这200 名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图) 根据频率分布直方图推测,这

29、 3 000名学生在该次数学考试中成绩小于 60 分的学生人数是_解:由频率分布直方图知,随机抽取的 200 名学生中成绩小于 60 分的学生人数是(0.0020.0060.012)1020040,设这 3 000 名学生中该次数学成绩小于 60 分的学生人数为 x,则 ,解得 x600.故40x 2003 000填 600.16已知某单位有 40 名职工,现要从中抽取 5 名职工,将全体职工随机按 140 编号,并按编号顺序平均分成 5 组按系统抽样方法在各组内抽取一个号码(1)若第 1 组抽出的号码为 2,则所有被抽出的职工号码为 _;(2)分别统计这 5 名职工的体重( 单位:kg),获

30、得体重数据的茎叶图如图所示,则该样本方差为_解:(1)由分组可知,抽号的间隔为 8,又第 1 组抽出的号码为 2,所以所有被抽出的职工号码为2,10,18,26,34.(2)由茎叶图知 5 名职工体重的平均数 x 69,则该样本的方差 s2 (5969)59 62 70 73 815 152(6269) 2 (7069) 2(73 69) 2(81 69) 262.故填 2,10,18,26,34;62.三、解答题:共 70 分解答应写出文字说明、证明过程或演算步骤17(10 分) 从参加环保知识竞赛的学生中抽出 60 名,将其成绩 (均为整数)整理后画出的频率分布直方图如图,回答下列问题:(

31、1)79.5,89.5)这一组的频数、频率分别是多少?(2)估计这次环保知识竞赛的及格率(60 分及以上为及格)解:(1)频率为:0.025100.25,频数:600.2515.(2)因为 0.015100.025100.03100.005100.75 ,所以估计这次环保知识竞赛的及格率为 0.75.18(12 分)(2016成都校级模拟)记者对某城市的工薪阶层关于“义务献血”态度进行了调查,随机抽取了 60人,作出了他们的月收入的频率分布直方图(如图) ,同时得到了他们的月收入情况与“义务献血”赞成人数统计表(如表) :月收入( 百元) 赞成人数15,25) 825,35) 735,45)

32、1045,55) 655,65) 265,75) 2(1)试根据频率分布直方图估计这 60 人的月收入的中位数和平均数;(2)若从月收入(单位:百元)在65,75) 的被调查者中随机选取 2 人进行追踪调查,求被选取的 2 人都不赞成的概率解:(1)设中位数为 x,由直方图知:100.015100.015( x35)0.0250.5,解得 x43( 百元);平均数为(200.015300.015400.025500.02600.015 700.01) 1043.5(百元)(2)月收入(单位:百元 )在65, 75)的人数为 60100.016(人),由表格知赞成的人数为 2 人,则不赞成的人数

33、为 4 人,从这 6 人中任选 2 人有 C 15 种选法,被选取的 2 人都不赞成有 C 6 种选法,故所求概率26 24为 P .615 2519(12 分)(2016银川校级一模)某校高二文科一班主任为了解同学们对某时政要闻的关注情况,在该班进行了一次调查,发现在全班 50 名同学中,对此事关注的同学有 30 名,该班在本学期期末考试中政治成绩(满分100 分)的茎叶图如图所示(1)求“对此事不关注者”的政治期末考试成绩的中位数与平均数;(2)若成绩不低于 60 分记为“及格” ,从“对此事不关注者 ”中随机抽取 1 人,该同学及格的概率为 P1,从“对此事关注者”中随机抽取 1 人,该

34、同学及格的概率为 P2,求 P2P 1 的值;(3)若成绩不低于 80 分记为“优秀” ,请以是否优秀为分类变量补充下面的 22 列联表:政治成绩优秀 政治成绩不优秀 合计对此事关注者(单位:人)对此事不关注者(单位:人)合计是否有 90%以上的把握认为 “对此事是否关注”与政治期末成绩是否优秀有关系?参考数据:P(K2k 0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001k0 2.072 2.706 3.841 5.024 6.635 7.879 10.828参考公式:K2 ,其中 nabc d.n(ad bc)2(a b)(c d)(a c)(b d)解:(

35、1)“对此事不关注者”的 20 名同学,成绩从低到高依次为:42,46,50,52,53,56,61,61,63,64,66,66,72,72,76,82,82,86,90,94,中位数为65,64 662平均数为 (42465052 53566161636466667272768282869094) 66.7.120(2)由条件可得 P1 ,P 2 ,20 620 710 30 530 56所以 P2P 1 .56 710 215(3)补充的 22 列联表如下:政治成绩优秀 政治成绩不优秀 合计对此事关注者(单位:人) 12 18 30对此事不关注者 5 15 20(单位:人)合计 17 3

36、3 50由 22 列联表可得 K2 1.203 26.635,所以能有 99%的把握认为“网购者对商品满意与对服务满意之间有关系” (2) 每次购物时,对商品和服务都满意的概率为 ,且 X 的取值可以是 0,1,2,3.25P(X0) ;(35)327125P(X1)C ;13(25) (35)254125P(X2)C ;23(25)2(35)136125P(X3)C .3(25)3(35)08125X 的分布列为:X 0 1 2 3P27125 54125 36125 8125所以 E(X)0 1 2 3 .27125 54125 36125 8125 65或者由于 XB ,得 E(X)3

37、.(3,25) 25 6521(12 分)(2017 届重庆第八中学二调 )某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费 x(单位:千元)对年利润 y(单位:万元 )的影响,对近 5 年的宣传费 xi 和年利润 yi(i1,2,3,4,5)进行了统计,列出了下表:x(单位:千元) 2 4 7 17 30y(单位:万元) 1 2 3 4 5员工小王和小李分别提供了不同的方案(1)小王准备用线性回归模型拟合 y 与 x 的关系,请你帮助建立 y 关于 x 的线性回归方程;(系数精确到 0.01)(2)小李决定选择对数回归模型拟合 y 与 x 的关系,得到了回归方程: 1.450ln x

38、0.024,并提供了相关指数y R20.995.请用相关指数说明选择哪个模型更合适,并利用所选模型预测年宣传费为 4 万元的年利润(精确到 0.01)(小王也提供了他的分析数据 1.15)521()ii参考公式:相关指数 R21 ,niiiiiy12)(回归方程 x 中斜率和截距的最小二乘估计公式分别为:y b a b 12().niiiii ybx,参考数据:ln403.689, =538.251()ii解:(1)12,=3, =69,所以 0.13, =1.44,51iiixyb a 小王建立 y 关于 x 的线性回归方程为 =0.13x+1.44.y (2) 10,所以小王模型的相关指数

39、 R20.89,这个值比小李模型相关指数小,故小李模型的251()ii拟合度更好,所以选择小李提供的模型更合适当 x40 时,由小李模型得 5.37,y 预测年宣传费为 4 万元的年利润约为 5.37 万元22(12 分)(2016湖北七校联盟高三 2 月联考)心理学家发现视觉和空间能力与性别有关,某数学兴趣小组为了验证这个结论,从兴趣小组中按分层抽样的方法抽取 50 名同学 (男 30 人,女 20 人), 给所有同学几何题和代数题各一题,让各位同学自由选择一道题进行解答选题情况如下表:(单位:人)几何题 代数题 总计男同学 22 8 30女同学 8 12 20总计 30 20 50(1)能

40、否据此判断有 97.5%的把握认为视觉和空间能力与性别有关?(2)经过多次测试后,女生甲每次解答一道几何题所用的时间在 57 分钟,女生乙每次解答一道几何题所用的时间在 68 分钟,现甲、乙各解同一道几何题,求乙比甲先解答完的概率;(3)现从选择做几何题的 8 名女生中任意抽取两人对她们的答题情况进行全程研究,记甲、乙两女生被抽到的人数为 X,求 X 的分布列及数学期望 E(X)附表及公式:P(K2k) 0.15 0.10 0.05 0.025 0.010 0.005 0.001k 2.072 2.706 3.841 5.024 6.635 7.879 10.828K2 .n(ad bc)2(

41、a b)(c d)(a c)(b d)解:(1)由表中数据得 K2 的观测值k 5.5565.024,所以能根据已知判断有 97.5%的把握认为视觉和空间能力50(2212 88)230203020 509与性别有关(2)设甲、乙解答一道几何题的时间分别为 x,y 分钟,则基本事件满足的区域为不等式组 表5 x 7,6 y 8)示的平面区域(如图所示)设事件 A 为“乙比甲先解答完此道题 ”,则满足的区域为 xy(图中阴影部分所示) 所以由几何概型 P(A) ,即乙比甲先解答完的概率为 .121122 18 18(3)在选择做几何题的 8 名女生中任意抽取 2 人,抽取方法有 C 28 种,其中甲、乙两人没有一个人被抽到28有 C 15 种;恰有一人被抽到有 C C 12 种;两人都被抽到有 C 1 种,所以 X 可能的取值为26 12 16 20,1,2,且 P(X0) , P(X1) ,P(X2) .1528 1228 37 128X 的分布列为X 0 1 2P1528 37 128所以 E(X)0 1 2 .1528 37 128 12

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 实用文档 > 简明教程

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报