1、一、选择题(本大题共 12 小题,每小题 5 分,共 60 分在每小题给出的四个选项中,只有一项是符合题目要求的)1分析人的身高与体重的关系,可以用( )A残差分析 B回归分析C等高条形图 D独立性检验解析: 因为身高与体重是两个具有相关关系的变量,所以要用回归分析来解决答案: B2设(x 1,y 1), (x2,y 2), (xn,y n)是变量 x 和 y 的 n 个样本点,直线 l 是由这些样本点通过最小二乘法得到的线性回归直线(如图) ,以下结论中正确的是 ( )Ax 和 y 的相关系数为直线 l 的斜率Bx 和 y 的相关系数在 0 到 1 之间C当 n 为偶数时,分布在 l 两侧的
2、样本点的个数一定相同D直线 l 过点( , )x y解析: 线性回归直线必过样本点中心( , ),故选 D.x y答案: D3下列关于回归分析与独立性检验的说法正确的是( )A回归分析和独立性检验没有什么区别B回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定关系C回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验D独立性检验可以 100%确定两个变量之间是否具有某种关系解析: 回归分析是对两个变量之间的相关关系的一种分析,而相关关系是一种不确定的关系,通过回归分析可以确定两个变量之间具有的近似关系;而独立性检验是对两个变量之间是否具有
3、某种关系的分析,并且可以分析这两个变量在多大程度上具有这种关系,但不能 100%肯定这种关系故选 C.答案: C4(2014蚌埠市高二第二学期期末学业水平检测) 已知回归直线的斜率的估计值是1.23,样本中心为(4,5),则回归直线方程为( )A. 1.23x4 B. 1.23x5y y C. 1.23x 0.08 D. 1.23x2.15y y 解析: 设回归直线方程为 x ,y b a 由已知知 1.23,b 即 1.23x ,y a 又回归直线过样本中心(4,5),代入得 0.08.a 故选 C.答案: C5对于回归分析,下列说法错误的是( )A在回归分析中,变量间的关系若是非确定关系,
4、那么因变量不能由自变量唯一确定B线性相关系数可以是正的,也可以是负的C回归分析中,如果 r21,说明 x 与 y 之间完全相关D样本相关系数 r(1,1)解析: 由回归分析和 r 的意义可知选 D.答案: D6甲、乙、丙、丁四个研究性学习小组分别对 x,y 两个变量的线性相关性做试验,并用回归分析的方法求得相关系数 r 和残差平方和 Q( , )的值如下表:a b 甲 乙 丙 丁r 0.83 0.89 0.81 0.79Q( , )a b 108 102 114 118则四个小组的试验结果中,体现了两变量具有更强的线性相关性的是( )A甲 B乙C丙 D丁解析: 乙小组试验结果的相关系数 r 最
5、大,残差平方和最小,故选 B.答案: B7为了探究患慢性支气管炎是否与吸烟有关,调查了 409 名 50 岁以上的人,现已将得到的数据进行计算得 K2 12.58,则下列说法正确的是 ( )A50 岁以上的人患慢性支气管炎与吸烟无关B在 100 个 50 岁以上的患慢性支气管炎的人中一定有 95 人有吸烟习惯C在 100 个 50 岁以上的患慢性支气管炎的人中一定有 99 人有吸烟习惯D我们有 99.9%的把握认为 50 岁以上的患慢性支气管炎与吸烟习惯有关解析: 因 K212.5810.828,所以我们有 99.9%的把握认为患慢性支气管炎与吸烟习惯有关故选 D.答案: D8下列关于残差图的
6、描述错误的是( )A残差图的横坐标可以是编号B残差图的横坐标可以是解释变量和预报变量C残差点分布的带状区域的宽度越窄相关指数越小D残差点分布的带状区域的宽度越窄残差平方和越小解析: 由于残差图纵坐标为残差,横坐标可以选用样本编号或样本数据或估计值,A,B 正确,又由残差图的性质知 D 正确,故选 C.答案: C9如图所示,图中有 5 组数据,去掉哪组数据后(填字母代号) ,剩下的 4 组数据的线性相关性最大( )AE BCCD DA解析: 由题图中五个点的分布易知选 A.答案: A10甲、乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下列联表:优秀 不优秀 合计甲班 1
7、0 35 45乙班 7 38 45合计 17 73 90利用独立性检验估计,你认为推断“成绩与班级有关系”错误的概率介于( )A0.30.4 B0.40.5C0.50.6 D0.60.7解析: K 2901038 73524545177390135225130250.652 70.455P(K20.455) 0.5,答案: B11以下是两个变量 x 和 y 的一组数据:x 1 2 3 4 5 6 7 8y 1 4 9 16 25 36 49 64则这两个变量间的线性回归方程为( )A. x 2 B. y y xC. 9x15 D. 15x9y y 解析: 根据数据可得 4.5, 25.5,x
8、y204, 877 2,ni 1x2ini 1y2iiyi 1 296.ni 1x 9,b ni 1xiyi nx yni 1x2i nx2 1 296 84.525.5204 84.52 25.594.515.a y b x 9x15.y 故选 C.答案: C12变量 x,y 具有线性相关关系,当 x 取值为 16,14,12,8 时,通过观测得到 y 的值分别为 11,9,8,5.若在实际问题中,y 最大取值是 10,则 x 的最大取值不能超过( )A14 B15C16 D17解析: 根据题意 y 与 x 呈正相关关系,由最小二乘法或计算器求得回归系数0.857, 0.729,所以线性回归
9、方程为 0.729x0.857.当 10 时,a b y y 得 x15.答案: B二、填空题(本大题共 4 小题,每小题 4 分,共 16 分请把正确答案填在题中横线上)13对于回归直线方程 4.75x257,当 x28 时,y 的估计值为_y 解析: 4.7528257390.y 答案: 39014(2014福州市高二期末联考) 下面是一个 22 列联表:y1 y2 总计x1 a 21 70x2 5 c 30总计 b d 100则 bd_.解析: a702149,c30525,b49554,d212546,bd8.答案: 815(2014湖北省重点中学高二上学期期末考试) 下列命题:用相关
10、系数 r 来刻画回归的效果时,r 的值越大,说明模型拟合的效果越好;对分类变量 X 与 Y 的随机变量的 K2 观测值来说,K 2 越小, “X 与 Y 有关系”可信程度越大;两个随机变量相关性越强,则相关系数的绝对值越接近 1;其中正确命题的序号是_(写出所有正确命题的序号)解析: 正确的是,是由于 r 可能是负值,中 K2 越大, “X 与 Y 有关系”可信程度越大答案: 16为考察高中生的性别与是否喜欢数学课程之间的关系,在某高中的学生中随机地抽取 300 名学生,得到下表:喜欢数学课程 不喜欢数学课程 合计男 37 85 122女 35 143 178合计 72 228 300则可求得
11、 K2 值等于_ 解析: 由公式 K2nad bc2a bc da cb d30037143 35852122178722284.514.答案: 4.514三、解答题(本大题共 6 小题,共 74 分解答时应写出必要的文字说明、证明过程或演算步骤)17(本小题满分 12 分)调查在 23 级风的海上航行中男、女乘客的晕船情况,结果如下表所示:晕船 不晕船 合计男性 12 25 37女性 10 24 34合计 22 49 71根据此资料,你是否认为在 23 级风的海上航行中男性比女性更容易晕船?解析: K 2 0.08.711224 2510222493734因为 0.0810.828,故年龄与
12、休息时间有关20(本小题满分 12 分)为了研究男羽毛球运动员的身高 x(单位:cm)与体重 y(单位:kg)的关系,通过随机抽样的方法,抽取 5 名运动员测得他们的身高与体重关系如下表:身高(x) 172 174 176 178 180体重(y) 74 73 76 75 77(1)从这 5 个人中随机的抽取 2 个人,求这 2 个人体重之差的绝对值不小于 2 kg 的概率;(2)求回归直线方程 bxa.y 解析: (1)抽取的 2 个人的体重为:(74,73),(74,76) ,(74,75) ,(74,77);(73,76),(73,75),(73,77);(76,75) ,(76,77)
13、;(75,77)满足条件的有 6 种情况,故:2 个人体重之差的绝对值不小于 2 kg 的概率 .610 35(2)x (172174176178180) 176,y (7473 767577)7515 15xix 4 2 0 2 4yiy 1 2 1 0 2b 0.44 4 0 0 816 4 0 4 16a750.41764.6, 0.4x4.6.y 21(本小题满分 13 分)(2013重庆卷)从某居民区随机抽取 10 个家庭,获得第 i 个家庭的月收入 xi(单位:千元 )与月储蓄 yi(单位:千元)的数据资料,算得 i80, i20,10i 1x10i 1yiyi 184, 720.
14、10i 1x10i 1x2i(1)求家庭的月储蓄 y 对月收入 x 的线性回归方程 x ;y b a (2)判断变量 x 与 y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为 7 千元,预测该家庭的月储蓄附:线性回归方程 x 中,y b a , ,b ni 1xiyi nx yni 1x2i nx2 a y b x其中 , 为样本平均值线性回归方程也可写为 x .x y y b a 解析: (1)由题意知 n10, i 8, i 2,x1nni 1x 8010 y 1nni 1y 2010又 n 2720108 280, iyin 184108224,ni 1x2i xni 1x x
15、y由此得 0.3, 20.380.4,b ni 1xiyi nx yni 1x2i nx2 2480 a y b x故所求回归方程为 0.3x0.4.y (2)由于变量 y 的值随 x 的值增加而增加( 0.30),故 x 与 y 之间是正相关b (3)将 x7 代入回归方程可以预测该家庭的月储蓄为 0.370.41.7( 千元)y 22(本小题满分 13 分)假设一个人从出生到死亡,在每个生日都测量身高,并作出这些数据散点图,则这些点将不会落在一条直线上,但在一段时间内的增长数据有时可以用线性回归来分析下表是一位母亲给儿子作的成长记录:年龄 /周岁 3 4 5 6 7 8 9身高 /cm 9
16、0.8 97.6 104.2 110.9 115.6 122.0 128.5年龄 /周岁 10 11 12 13 14 15 16身高 /cm 134.2 140.8 147.6 154.2 160.9 167.6 173.0(1)作出这些数据的散点图;(2)求出这些数据的回归方程;(3)对于这个例子,你如何解释回归系数的含义?(4)解释一下回归系数与每年平均增长的身高之间的联系解析: (1)数据的散点图如下:(2)用 y 表示身高,x 表示年龄,则数据的回归方程为 6.317x71.984;y (3)在该例子中,回归系数 6.317 表示该人在一年中增加的高度;(4)回归系数与每年平均增长的身高之间近似相等