1、一、选择题1(2010 年长沙一中第九次月考 )在对两个变量 x、y 进行线性回归分析时一般有下列步骤:对所求出的回归方程作出解释;收集数据(x i,y i),i1,2,n;求线性回归方程;求相关系数;根据所搜集的数据绘制散点图如果根据可靠性要求能够判定变量 x、y 具有线性相关性,则在下列操作顺序中正确的是( )A BC D【答案】 D2观察两个相关变量的如下数据:x 1 2 3 4 5 5 4 3 2 1y 0.9 2 3.1 3.9 5.1 5 4.1 2.9 2.1 0.9则两个变量间的回归直线方程为( )A. 0.5 x1 B. xy y C. 2x0.3 D. x 1y y 【解析
2、】回归直线经过样本点的中心( , ),因此只需求出( , ),再代入所给选项逐一x y x y验证即可,答案为 B.【答案】 B3两个变量 y 与 x 的回归模型中,分别选择了 4 个不同模型,它们的相关系数 r 如下,其中拟合效果最好的模型是( )A模型 1 的相关系数 r 为0.98B模型 2 的相关系数 r 为 0.80C模型 3 的相关系数 r 为 0.50D模型 4 的相关系数 r 为 0.25【解析】|r|越接近于 1,拟合效果越好【答案】 A4如图所示,有 5 组(x,y)数据,去掉哪组数据后,剩下的 4 组数据的线性相关系数最大( )AD 组BE 组CA 组D任一组【答案】 A
3、5有一组样本数据(x 1,y 1),( x2,y 2),(x n,y n),得到直线方程 bxa,那么下y 列说法不正确的是( )A. bxa 中 a by y x B直线 bxa 至少经过点( x1,y 1),(x 2,y 2),(x n,y n)中的一个点y C直线 bxa 的斜率为 by ni 1xiyi nx y ni 1x2i nx 2D直线 bxa 和各点(x 1,y 1),( x2,y 2),(x n,y n)的误差平方和 yi( bxia) 2y ni 1是该坐标平面上所有的直线与这些点的偏差中最小的直线【解析】用最小二乘法求出的直线 bxa 是与各点的总体偏差最小的直线,而不
4、一y 定过其中的样本点【答案】 B二、填空题6已知回归方程 4.4x 838.19,则可估计 x 与 y 的增长速度之比约为 _y 【解析】x 每增长 1 个单位,y 增长 4.4 个单位,故增 长的速度之比约为 14.4522;事实上所求的比值为回归直线方程斜率的倒数【答案】 5227对四对变量 y 与 x 进行相关性检验,已知 n 是观测值的组数,r 是相关系数且已知:(1)n7,r0.9533 ;(2) n15 ,r0.3012;(3)n17,r0.4991 ;(4) n 3,r0.9950.则变量 y 与 x 的线性关系很强的是_【解析】统计学中常用相关系数 r 来衡量两个变量之间线性
5、关系的强弱;|r| 1,|r| 越接近于 1,则 y 与 x 的线性关系越强【答案】 (1)(4)8某高校统计初步课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:专业 非统计专业 统计专业性别男 13 10女 7 20为了判断主修统计专业是否与性别有关系,根据表中数据,得到 K24.8443.841,所以断定主修统计专业与性别有关系,那么501320 107223272030这种判断出错的可能性约是_【解析】K 23.841,我们有 95%的把握认为有关系,判断出错的可能性约为 5%.【答案】 5%9许多因素都会影响贫穷,教育也许是其中之一,在研究这两个因素的关系时收集了美国 50
6、 个州的成年人受过 9 年或更少教育的百分比(x) 和收入低于官方规定的贫困县的人数占本州人数的百分比(y)的数据,建立的回归直线方程为 0.8x4.6,斜率的估计等于y 0.8,说明_,成年人受过9 年或更少教育的百分比(x)和收入低于官方的贫困县的人数占本州人数的百分比(y)之间的相关系数_(填“大于 0”或“小于 0”)【答案】 一个地区受过 9 年或更少教育的百分比每增加 1%,收入低于官方规定的贫困县的人数占本州人数的百分比将增加 0.8%左右 大于 0三、解答题10一机器可以按各种不同的速度运转,其生产的物件有一些会有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用 x 表
7、示转速( 单位:转/秒),用 y 表示每小时生产的有缺点物件个数现观测得到(x,y)的 4 组观测值为(8,5),(12,8) ,(14,9),(16,11)(1)假定 y 与 x 之间有线性相关关系,求 y 对 x 的回归直线方程;(2)若实际生产中所容许的每小时最大有缺点物件数为 10,则机器的速度不得超过每秒多少转?( 精确到 1 转/秒)【解析】(1)设回归直线方程为 x ,y b a 经计算得 12.5, 8.25, iyi438, 660,x y4i 1x4i 1x2i于是 ,b 438 412.58.25660 412.52 5170 8.25 12.5 .a y b x 517
8、0 67故所求的回归直线方程为 x .y 5170 67(2)由 x 10,得 x 14.902,则机器速度不得超过 15 转/秒y 5170 67 7605111(2009 年 辽宁) 某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在29.94,30.06) 的零件为优质品从两个分厂生产的零件中各抽出了 500 件,量其内径尺寸,得结果如下表:甲厂分组 29.86,29.90) 29.90,29.94) 29.94,29.98) 29.98,30.02)频数 12 63 86 182分组 30.02,30.06) 30.06,30.10) 30.10,30.14频数 92
9、61 4乙厂分组 29.86,29.90) 29.90,29.94) 29.94,29.98) 29.98,30.02)频数 29 71 85 159分组 30.02,30.06) 30.06,30.10) 30.10,30.14频数 76 62 18(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面 22 列联表,并问是否有 99%的把握认为“两个分厂生产的零件的质量有差异” 甲 厂 乙 厂 合计优质品非优质品合计附:K 2 ,nad bc2a bc da cb dP(K2k) 0.05 0.01k 3.841 6.635【解析】(1)甲厂抽查的产品中有 360 件优质
10、品,从而甲厂生产的零件的优质品率估计为 72%.360500乙厂抽查的产品中有 320 件优质品,从而乙厂生 产的零件的 优质品率估计为 64%.320500(2)22 列联表如下:甲厂 乙厂 合计优质品 360 320 680非优质品 140 180 320合计 500 500 1000K2 7.3536.635,1000360180 3201402500500680320所以有 99%的把握认为“两个分厂生产的零件的质量有差异” 附加探究为了解大学生观看湖南卫视综艺节目“快乐大本营”是否与性别有关,一所大学心理学教师从该校学生中随机抽取了 50 人进行问卷调查,得到了如下的列联表:喜欢看“
11、快乐大本营” 不喜欢看“快乐大本营” 合计女生 5男生 10合计 50若该教师采用分层抽样的方法从 50 份问卷调查中继续抽查了 10 份进行重点分析,知道其中喜欢看“快乐大本营”的有 6 人(1)请将上面的列联表补充完整;(2)是否有 99.5%的把握认为喜欢看 “快乐大本营”节目与性别有关?说明你的理由;(3)已知喜欢看“快乐大本营”的 10 位男生中,A 1,A 2, A3,A 4,A 5 还喜欢看新闻,B1,B 2,B 3 还喜欢看动画片,C 1,C 2 还喜欢看韩剧,现再从喜欢看新闻、动画片和韩剧的男生中各选出 1 名进行其他方面的调查,求 B1 和 C1 不全被选中的概率下面的临界
12、值表供参考:p(K2k) 0.15 0.10 0.05 0.025 0.010 0.005 0.001k 2.072 2.706 3.841 5.024 6.635 7.879 10.828(参考公式:K 2 ,其中 nabcd)nad bc2a bc da cb d【解析】(1)由分层抽样知识知,喜欢看“快乐大本营”的同学有 50 30 人,故不610喜欢看“快乐大本营”的同学有 503020 人,于是可将列联表补充如下:喜欢看“快乐大本营” 不喜欢看“快乐大本营” 合计女生 20 5 25男生 10 15 25合计 30 20 50(2)K 2 8.3337.879.502015 1052
13、30202525有 99.5%的把握认为喜欢看 “快乐大本营”与性别有关(3)从喜欢看的 10 位男生中选出喜欢看韩剧、喜欢看新闻、喜欢看动画片的各 1 名,其一切可能的结果组成的基本事件共有 N53230 个,用 M 表示“B 1,C 1 不全被选中”这一事件,则其对立事件 表示“B 1,C 1 全被选中” 这一事件,由于 由(A 1,B 1,C 1),M M (A2, B1,C 1), (A3,B 1,C 1), (A4,B 1,C 1),(A 5,B 1,C 1)5 个基本事件组成,所以 P( )M ,530 16由对立事件的概率公式得 P(M)1P( )1 .M 16 56反馈与评价内 容自学成就互助成就困难求助错题归因