收藏 分享(赏)

综合复习题(2013).docx

上传人:myw993772 文档编号:7744049 上传时间:2019-05-25 格式:DOCX 页数:22 大小:275.18KB
下载 相关 举报
综合复习题(2013).docx_第1页
第1页 / 共22页
综合复习题(2013).docx_第2页
第2页 / 共22页
综合复习题(2013).docx_第3页
第3页 / 共22页
综合复习题(2013).docx_第4页
第4页 / 共22页
综合复习题(2013).docx_第5页
第5页 / 共22页
点击查看更多>>
资源描述

1、1.最近的医学研究表明,有一种叫“佳乐宁”的物质会影响人们对高脂肪食物的需求,一个人脑内所产生的这种物质愈多,想吃高脂肪食物的欲望就越高。近来,有一家制药公司在研制一种实验药物以阻断“佳乐宁”的产生或传导,又不能影响对健康食物的食欲。该公司一位神经学科学家相信此药物在控制肥胖上将会非常有效,并相信每日规律地服用此药将导致体重下降。于是展开一项实验,随机抽取 15 位志愿的肥胖女性并提供 6 个月的药量,分别记录每位受试者实验开始和结束后的体重。数据如下:受试者编号 试前体重(磅) 试后体重(磅)1 165 1452 143 1373 175 170 15 169 154对此数据分别用 Exce

2、l 和 SPSS 进行分析,结果如下(显著性水平为 0.05):表 4.1.1 Excel 运算结果受试前体重 受试后体重平均值 162.07 150.27方 差 259.35 237.92观测值 15 15假设平均差 0 df(自由度) 14 t Stat(t 值) 7.71 P 值(单尾) 0.000 t 单尾临界值 1.76 P(值(双尾) 0.000 t 双尾临界值 2.14 表 4.1.2 SPSS 运算结果要求:根据上述资料回答下列问题:(1)上述简单统计推断分析的是( ) 。A.单总体均值检验 B.成对样本均值的检验C.来自两个总体的独立样本均值的检验(2)根据检验目的,写出原假

3、设和备择假设,并说明各自的含义。(3)根据样本统计量的计算结果和相应显著性水平的临界值的对比,说明检验结果和理由。(4)根据上述 P 值,说明检验结果和理由。(5)写出受试前与受试后体重差的 95%的置信区间。2. 十六个不同的零食所含卡路里数据如下图所示(单位:卡):热量茎叶图Frequency Stem & Leaf1.00 11 . 22.00 11 . 885.00 12 . 333442.00 12 . 881.00 13 . 21.00 13 . 61.00 14 . 23.00 Extremes (=164)Stem width: 10Each leaf: 1 case(s)(1

4、)求出该组数据的众数和中位数;(2)说明均值、众数、中位数哪一个更具有代表性?说明理由。3.一家电话公司制订出一个广告计划,以增加客户长途电话的通话时间。为了解该计划的优点,公司对其进行小规模推广试验,他们从推广目标客户中随机抽取 100 位客户作为样本,并记录这 100 位客户在过去一个月长途电话的通话时间,然后公司在接下来的一个月里,在给用户的声明中加上一份特殊的广告传单,然后再记下这些客户该月的通话时间,数据如下表所示(分钟) 。客户 加入广告传单前 加入广告传单后1 92 1292 304 2493 48 214 100 217 487运用 Excel 对以上样本数据进行分析,分析结果

5、如下:描述统计结果均值 N 标准差 均值的标准误差推广后 202.68 100 147.106 14.711均值 N 标准差 均值的标准误差推广后 202.68 100 147.106 14.711推广前 171.89 100 133.051 13.305推广后-推广前均值差的检验结果注: 为推广前后样本数据之差 的均值did试根据上述结果回答以下问题(本题共 12 分)(1)公司对同一组客户测量他们前后的反应,这属于什么类型的样本?这样做的好处是什么?(2)公司是否可以认为,给用户的声明中加上一份特殊的广告传单对于提高用户长途电话的通话时间是有帮助的?请写出对应的原假设、备择假设及其含义,并

6、给出检验结果及理由。(3)给出广告传单推广后比推广前其用户长途电话的平均通话时间之差的 95%的置信区间,并简要说明其含义。4.为了研究地理位置对商场销售额影响,研究者分别调查了商业街(9 家) 、居民区(7 家) 、CBD(8 家)和开发区(7 家)共 31 家零售商,调查得人均月销售额数据如下表所示:不同位置商场人均月销售额 单位:万元/人地理位置 商业街 居民区 CBD 开发区1 21 11 18 122 25 9 16 153 18 15 24 204 18 16 18 95 16 18 15 146 24 20 18 167 28 16 16 108 22 - 10 - 样本 编号9

7、 24 - - 均值之差的95%置信区间标准差 标准误Lower Uppert 自由度 双侧P值30.79 68.41 6.84 17.22 44.36 4.50 99 .000利用 Excel 分析结果如下:差异源 离差平方和 自由度 均方 F P 值F (临05.界值)组间 308.3344 0.00134 2.960351组内 401.8591 27 总计 710.1935 30 要求:(1)根据已知资料,填出上述表中空白格的数字(2)写出上述分出方差分析的原假设和备择假设,并说明其含义(3)说明分析结果,并说明理由5.为了研究初中成绩与高中成绩的关系,随机抽查50名高一学生,登记其初三

8、成绩与高一成绩,并利用SPSS统计软件进行一元线性回归分析,结果输出如下: .795 .632 .625 7.22091R 4307.206 1 4307.206 82.606 .0002502.794 48 52.1426810.000 49 F P26.444 5.396 4.901 .000.651 .072 9.089 .000B t P试根据以上结果回答以下问题:(1)说明学生初三成绩与高一成绩之间的相关关系的形态;(2)写出估计的回归方程并解释回归系数的实际含义;(3)对上述拟合的回归方程进行评价。6为研究少年儿童成长发育状况,某研究所的 A 调查人员在某城市抽取 100 名 71

9、7岁的少年儿童作为样本,B 调查人员则抽取了 1000 名 717 岁的少年儿童作样本,请回答以下问题,并解释。(1)哪一位调查研究人员在其所抽取的样本中得到的少年儿童的平均身高较高?或者这两组样本的平均身高相同。(2)哪一位调查研究人员在其所抽取的样本中得到的少年儿童的身高标准差较大?或者这两组样本身高的标准差相同。(3)哪一位调查研究人员有可能得到这 1000 名少年儿童的最高者或最低者?对两位研究人员来说这种机会是相同的吗?7.某关于居民收入的研究报告将居民按收入高低划分为高收入组(上四分位数以上者) 、较高收入组(介于中位数与上四分位数之间者) 、较低收入组(下四分位数与中位数之间者)

10、和低收入组(低于下四分位数者) ,报告称,今年低收入组人群比重较去年有明显下降,说明居民收入有所提高。请从统计学角度指出该报告中有何错误?为什么?8. 美国洛杉矶湖人队 2000 年 14 名球员的薪水(百万美元)如下表:球 员 薪 水 球 员 薪 水奥尼尔 17.1 哈伯 2.1布莱恩特 11.8 格林 2霍利 5 乔治 1赖斯 4.5 肖 1费希尔 4.3 萨利 0.8福克斯 4.2 卢 0.7奈特 3.1 塞莱斯坦 0.3薪水茎叶图为了确定新年度球员薪水水平,球员工会与老板进行谈判。球队老板计算了 14 名球员的平均收入,其数值为 410 多万美元,老板觉得球员薪水太高了,不能再提高了。

11、而球员工会代表主张用中位数分析球员薪水水平,并绘制了茎叶图以支持自己的说法。要求:请说明球队老板和球员工会代表的争执原因是什么?你认为谁的主张更合理?为什么?9. 对 2006 年下列 31 个省市进行分析,调查得到各省市人均 GDP 等 6 个指标,各省市编号如下表 4.3.1:表 4.3.1 省份编号省份 编号 省份 编号 省份 编号北京 1 安徽 12 四川 23天津 2 福建 13 贵州 24河北 3 江西 14 云南 25山西 4 山东 15 西藏 26内蒙古 5 河南 16 陕西 27辽宁 6 湖北 17 甘肃 28吉林 7 湖南 18 青海 29黑龙江 8 广东 19 宁夏 30

12、上海 9 广西 20 新疆 31江苏 10 海南 21浙江 11 重庆 22利用 SPSS 进行分层聚类,结果如下图 1:要求:根据上述资料回答以下问题:(1)根据上图,如果将上述 31 个省市分为三类,则这三类分别包括那些省份; (2)根据上图,如果将上述 31 个省市分为五类,则北京与那些省市分为一类。10. 某大学教授喜欢游泳,他记录了每次游 2000 米所用的时间(分钟)和游完泳后的脉搏次数,共记录了 23 次。该教授分析了时间与脉搏之间的关系,计算得二者的相关系数为-0.74598,线性回归方程为 ,他对相关系数和回归方程进行了时 间脉 搏 695.47统计检验,检验结果表明在 0.

13、05 的显著性水平下均显著。要求:(1)结合上面资料,说明该教授游泳时间与脉搏次数的关系。(2)本周末该教授游 2000 米用时 34.3 分钟,请利用上面回归方程预测他游完时的脉搏次数。该教授实际上游完时的脉搏次数为 152,你的预测与实际数一致吗?应怎样理解二者的差异。11. 为了研究小麦品种和施肥方式对产量的影响,针对三种品种和两种施肥方式进行实验,得方差分析数据如下:表 2-1 方差分析表要求:根据上述数据回答以下问题:(1)试写出方差分析的原假设和备择假设,并解释其含义;(2)分析品种、施肥方式及其交叉作用对小麦产量的影响;12. 某公司对 16 种润滑油进行了测定,其 “氧化安定性

14、”指标用旋转氧弹方法测定。人们普遍认为,基础油中的硫含量和碱氮含量对润滑油氧化安定性有着不同的影响。现用相关与回归分析方法对其氧化安定性影响进行分析,分析结果如下。试回答以下问题。关 3-1 Correlations(关 关 关 关 )1 .293 .516*. .271 .04116 16 16.293 1 -.558*.271 . .02516 16 16.516* -.558* 1.041 .025 .16 16 16PearsonCorrelation(Pearson估 估 估 估 )Sig. (2-tailed)(估估 P估 )NPearsonCorrelation(Pearson估

15、 估 估 估 )Sig. (2-tailed)(估估 P估 )NPearsonCorrelation(Pearson估 估 估 估 )Sig. (2-tailed)(估估 P估 )N估 估 估 X1估 估 估 估估 估 估 估估 估 估 X1 估 估 估 估 估 估 估 估Correlation is significant at the 0.05 level (2-tailed).*. 关 3-2 Model Summary(关 关 关 关 关 关 ).904a .817 .788 34.3888Model1R R Square (估 估 估 估 )AdjustedR Square估 估 估

16、 估估 )Std. Error oftheEstimate(估估 估 估 估 )Predictors: (Constant), 估 估 估 估 , 估 估 估 X1a. 关 3-3 ANOVA(关 关 关 关 ) b68467.26 2 34233.628 28.948 .000a15373.68 13 1182.59183840.94 15Regression(估估 估 估 估 )Residual(估 估估 估 估 )TotalModel1Sum ofSquares(估 估 估估 估 ) df Mean Square(估 估 ) F Sig.Predictors: (Constant), 估

17、 估 估 估 , 估 估 估 X1a. Dependent Variable: 估 估 估 估b. 关 3-4 Coefficients(关 关 关 关 关 关 ) a180.630 17.746 10.179 .00010.708 1.789 .743 5.985 .000-.607 .097 -.776 -6.246 .000(Constant)(估 估 估 )估 估 估 X1估 估 估 估Model1B Std. ErrorUnstandardized Coefficients (估 估 估 估 估 估 )BetaStandardizedCoefficients(估 估 估 估 估 )t

18、 Sig.(P估 )Dependent Variable: 估 估 估 估a. 要求:(1)根据相关分析结果从相关方向、相关程度等方面说明硫含量、碱氮含量与旋转氧弹之间的关系;(2)写出对回归方程整体线性关系进行检验的原假设和备择假设,并根据上述资料说明检验结果及含义(=0.01) ;(3)根据上述资料写出估计的回归方程,并说明对各变量回归系数的显著性进行检验结果及含义(=0.01) ;13. 根据人口普查资料得到 14 个地区各自的总人口(千人) 、受教育年限中位数、总就业人数(千人) 、保健服务业就业人数(千人)和家庭收入中位数(万美元)(1)利用该资料进行主成分分析,得到 SPSS 运行

19、结果如下:表 6.1.1 主成分分析方差分解表 6.1.2 主成分载荷要求:根据上述分析结果回答以下问题:若要求选择的主成分占总方差的 85%以上,请写出选择的主成分;请写出前两个主成分与原变量(或原变量的标准化)的线性关系式。(2)利用该资料进行因子分析,得到 SPSS 运行结果如下:表 6.2.1 因子提取结果(因子载荷)因子载荷图要求:根据上述分析结果回答以下问题: 写出上述两个因子与各个变量的线性关系式; 据上述图 2,说明第一因子、第二因子对原变量的代表关系。14. 为了研究年龄与爱好的关系,随机调查了 124 人,得数据如下表 2.1:表 2. 1 年龄与爱好观察值分布年龄 合计观

20、测值青年 中年 老年戏曲 2 10 20 32歌舞 35 20 5 60爱好球赛 20 10 2 32合计 57 40 27 124利用 SPSS 对年龄与爱好的相关分析及其检验,结果如下表 2.2:表 2.2 卡方检验表要求:根据上述资料回答以下问题:(1)根据表 2.1,计算年龄与爱好独立情况下的期望频数,并填入下表 2.3;表 2.3年龄 合计期望值青年 中年 老年戏曲 32歌舞 60爱好球赛 32合计 57 40 27 124(2)根据表 2.2,说明卡方检验结果,并写出其原假设和备择假设。15. 为了研究公立大学与私立大学学生费用支出情况,随机抽取了 15 名公立大学学生和 10名私

21、立大学学生,统计了他们每年的花费金额(单位:万元) ,比较其差异情况。计算结果如下:统计量 公立大学 私立大学均值 7.56 16.51方差 5.86 5.34双总体等方差均值之差检验95%的置信区间t 自由度 双侧P-值 均值 之差 标准 误差 Lower(下限) Upper(上限)-9.22 23 0.00 -8.95 0.97 -10.96 -6.94要求:(1)计算两者的合并方差;(2)数据能否支持公立大学费用确实低于私立大学?请写出原假设和备择假设,并说明显著性水平为 0.05 的检验结果;(3)请给出二者差值的 95%的置信区间16. 以下是从某个学院上学期所有参加统计学考试的同学

22、中随机抽取的男生和女生的成绩情况。男生 女生平均分 76.630 78.433 标准误差 2.295 2.886 中位数 78 85众数 84 85标准差 11.927 14.431 峰度 -0.436 0.894 偏度 -0.639 -1.209 最小值 50 40最大值 94 95观测数 27 25(1)试用描述统计方法对上述 27 个男同学、25 个女同学的考试情况进行比较分析(2)表中的标准差和标准误差分别表示什么?它们之间有什么关系?(3)以 95%的置信水平,分别对该学院所有男同学、所有女同学的统计学考试平均成绩进行区间估计。已知 t0.025(24)=2.064, t0.025(

23、25)=2.060, t0.025(26)=2.056, t0.025(27)=2.052 17. 某汽车经销商委托某高校工商管理学院教授调查研究某城市对家用轿车的需求分析,希望从家庭收入、家庭人口、家庭所在地、住房面积、家庭成员所从事职业等方面分析这些因素对家用轿车需求量的影响,并要求进行定量分析,建立统计模型,该模型能够用于统计预测。该教授经多次与经销商沟通,设计出调查问卷,并得到经销商的确认。该教授初步提出以下三种调查设想:方法一:根据该市各居民委员会家庭户数比例,分配样本量,并在各居民委员会中随机抽取样本户,进行问卷调查;方法二:充分利用学校学生众多的优势,展开调查。具体做法是:根据学

24、校学籍登记表得到学生学号,从中随机抽取一定量的学生,针对这些被抽中学生的家庭进行问卷调查;方法三:安排该校学生进行街头拦截访问,随机拦访一定量的行人。根据以上资料,回答以下问题:1.请说明该调研中调查对象总体是什么?理想的抽样框和抽样单位是什么?2.请说明上述三种抽样方案各是什么抽样方法,并评价其优劣。18. 为评价家电行业售后服务质量,随机抽取了 100 个家庭构成的一个样本,服务质量的等级分别表示为:A:好, B 较好,C 一般,D 较差,E 差调查结果如下:B E C C A D C B A ED A C B C D E C E EA D B C C A E D C BB A C D E

25、 A B D D CC B .(1) 指出上面数据属于什么类型数据?(2) 可以用什么图形,反映服务质量的分布?19. 某市教材委员会设计了 4 本不同的小学教材,为了比较其教学效果,按随机区组实验原则,将小学分为城镇一般小学、城镇重点小学和乡村小学三个区组,分别在每个区组中随机抽取 4 所小学,它们被随机地指派一种教材,经一年教学后通过统一考试得到各学校的平均成绩(10 分制) ,进行方差分析,数据与结果如下:教材 1 教材 2 教材 3 教材 4城镇一般 4.5 6.4 7.2 6.7城镇重点 8.8 7.8 9.6 7乡村小学 5.9 6.8 5.7 5.2差异源 SS df MS F

26、双侧 P-值 F 临界值行 13.68 2 0.034258 5.14325285列 3 0.512185 4.75706266误差 6.58 6 总计 23.08 11 要求:(1)根据已知资料,填出上述表中空白格的数字(2)写出上述分出方差分析的原假设和备择假设,并说明其含义(3)说明分析结果,并说明理由(4)上述方差分析没有考虑教材与学校的交互作用,请说明上述数据能否进行有交互作用的方差分析?20. 一所大学有 3000 名男生,其身高服从均值为 174cm、标准差为 3cm 的正态分布。现从中有放回地随机抽取 25 人作为样本,测量其身高。要求:(1)理论上讲,可以形成多少个不同的样本

27、?(请写出其表达式,不用计算结果) ;(2)这些样本的均值( )服从什么样的分布?其期望值是多少?x(3)为了衡量这些样本均值( )的差异程度,需计算什么样的统计量?请写出其表达式和计算结果。传统题一、平均数加权算术平均数1.某商业企业的资料如下: 劳动生产率(万元)职工数(人)1.5-2.02.0-2.52.5-3.0280090002000合计 13800(1)计算全公司的销售额;(2)计算全公司的平均劳动生产率。解:(1)各组组中值依次是:劳动生产率(万元)组中值(万元)1.5-2.02.0-2.52.5-3.01.752.252.75合计 -全公司的销售额:(各组组中值职工人数)=1.

28、752800+2.259000+2.752000=30650 万元(2)全公司平均劳动生产率人 )( 万 元 /2.138065fx二、时间数列1平均发展水平2平均发展速度3长期趋势预测2.某地区年末人口数如下:1996 1997 1998 1999 2000人口(万人) 1656 1793 1726 1760 1930(1)计算 1996 年到 2000 年的平均人口 万 人 )(17684293017621793265121 nyyn(2)平均发展速度 %90.31654G3.某啤酒厂 1998 年至 2005 年各年啤酒产量如下:年份 时间( )t 产量(万升)( )y199819992

29、0002001200220032004200512345678149156161164171179184194要求:(1)用最小二乘法拟合线性趋势模型;(2)预测该厂 2006 年啤酒产量。设趋势模型为: btay根据最小二乘法原理知:143.6320485869)(222 ttnb7.1.35ya得 t607.142(2)将 代入上述回归方程,有9t万 升 )(34.17ty三、抽样推断1平均数及比例的区间估计2平均数及比例的假设检验3最小样本容量的确定4.某厂商准备在北京投资一家快餐店,为进行可行性研究,现随机调查了在 7 家快餐店就餐的 49 位顾客,其消费额如下:15 38 26 24

30、 30 42 18 30 25 2616 34 44 20 35 24 26 34 48 1828 46 19 30 36 42 32 45 36 2147 26 28 31 42 45 36 24 28 2732 36 47 53 30 24 32 46 26要求:(1)计算该样本的算术平均数; 3249568nx(2)若顾客在快餐店的消费额服从正态分布,其样本标准差为 9.56,试估计置信度为90%的置信区间;大样本,总体标准差未知,用样本标准差替代,置信度 90%时, 645.12Z因总体单位未知,可按重复抽样计算抽样边际误差 ns225.496.5.12nsZ置信上限 元.34.2sx

31、置信下限 元75.29.2nZ即顾客在快餐店的消费额的置信度为 90%的置信区间为(29.75,34.25)5.某地区有 20000 亩小麦,采用不重复抽样调查其中的 2000 亩,测得平均亩产量为 500 公斤,标准差为 125 公斤,以可靠程度 95.45%,计算 20000 亩的平均亩产量。解:平均亩产的抽样标准误差 ( 公 斤 )65.2)01(25)1(2 Nns平均亩产在概率 95.45%(即 )的条件下,其抽样边际误差:2Z3.56.12/ NnsZx依区间估计 20000 亩小麦的平均亩产: 公 斤3.50x494.7 公斤 505.3 公斤6.为了了解某地区目前居民收入情况,

32、现随机抽取 25 人登记其月收入,得资料如下:收入(百元) 10 以下 1020 2030 3040 40 以上人数(人) 2 3 15 3 2要求:(1)若该地区居民收入服从 的分布,即总体方差为 100,试以 95%的)10,(Nx置信水平估计目前该地区居民月收入的可能范围。解:计算样本均值:625xf资料可知样本平均数抽样标准误差为: 2105n因居民收入服从正太分布,置信水平 ,可知95.0196.12Z即有21.963.2xZn因样本平均数 ,可得:5总体平均数置信下限 ( 百 元 )08.19.51x总体平均数置信上限 )(2322 百 元即依据该样本求得的总体平均数置信区间为(2

33、1.08,28.92)(2)若该地区居民收入服从 的分布,若要求置信水平为 95.45%、估计总)10,(Nx体平均数 的极限误差不超过 2 百元,在简单重置抽样的情况下,最少需抽取多少人进行调查?解:在简单重置抽样条件下: )(1022/ 人xZn7.某企业生产一批灯泡 10000 只,随机抽取 400 只作耐用时间试验和合格检验,测算结果,平均使用时间为 2000 小时,标准差为 12 小时,其中有 80 只不合格。要求:(1)试计算使用寿命和合格率的抽样标准误差。(2) )计算合格率的 95.45%的置信区间解:(1)抽样标准误差耐用时间的抽样标准误差 2()snN乙59.0)14(02

34、合格率的抽样标准误差:抽样合格率=320/400=80%=0.0196 或 1.96%(1)PnN)104()80(2)合格率的置信区间为:合格率的抽样边际误差=21.96%=3.92%/2(1)PpnZN039.8即(76.08%,83.92)8.一种元件,要求其使用寿命不低于 1 000 小时。现从中随机抽取 25 件,测得其平均寿命为 950 小时。已知该种元件寿命服从标准差为 100 小时的正太分布,试在显著性水平为0.01 的要求下确定这批元件是否合格?解:建立假设: 0:0:10H本检验为右侧检验,因显著性水平 ,查正态分布表得.34.2Z0.1计算统计量 5.2/1095/nxz

35、因 ,故拒绝原假设H9.已知某零件的尺寸服从正太分布,现从某天生产的零件中随机抽取 10 个,测得其长度(毫米)如下:14.8 15.1 14.6 15.2 14.915.0 14.8 15.1 15.3 14.7要求:(1)确定该种零件平均长度的置信区间,置信水平 %951(2)若要求该种零件的标准长度应为 15 毫米,试在显著性水平 条件下,0.检验该种零件是否符合标准要求?解:(1)由样本资料得:样本平均数: 95.140.nx样本标准差: 273.01)(2xs由于总体方差未知,用样本方差替代,小样本,样本均值服从 t 分布,计算得抽样标准误差为: 02.1.ns因置信水平 ,查表可得

36、%95126.)9()(025.2/ tt抽样边际误差 /2(1).6.7.13xstn置信下限 9.43.09541x置信上限 162 即在 95%的置信水平下,该零件平均长度的置信区间为(14.79,15.11)(2)由题意知此检验为双侧检验,故建立假设:5:15:10H因总体方差未知,用样本方差替代,所以 服从 t 分布,在显著性水平为nsx/0.05 时,t 检验临界值 26.)9()1(025.2/ tnt计算样本统计量 95.01/73.4/ sxt因 ,故不能拒绝原假设。/2(1)tn10.甲、乙两厂生产同种零件,已知零件长度均服从正态分布,且 , 。20乙23乙从甲厂生产的零件

37、中随机抽取 81 件,测得 厘米,从乙厂生产的零件中随机抽取40x乙100 件,测得 厘米。根据以上调查结果,能否认为甲、乙两厂生产的零件平均长420x乙度相等。建立假设: :210H0:21H计算检验统计量值: 12245.963810xzn与显著性水平 0.05 对应的临界值为 ,由于 ,所以拒绝原假设。.196z即不能否认两厂生产的材料平均长度相同。11用两种方法生产组装产品,为比较两种方法组装效率是否有显著差异,现随机独立抽取两组个人各 12 人,进行试验,得数据如下:原方法 新方法 原方法 新方法28302937322827223133203036373834283031263231

38、3326假设新旧方法方差相等,在 5%的显著性水平下能否认为新旧方法组装产品的劳动生产率相等。建立假设如下: 0:210H利用 EXCEL 统计功能计算如下:t-检验 : 双样本等方差假设变量 1 变量 2平均 32.25 28.5方差 15.47727273 18.45454545观测值 12 12合并方差 16.96590909假设平均差 0df 22t Stat 2.230069126P(T=t) 单尾 0.018132009t 单尾临界 1.717144335P(T=t) 双尾 0.036264019t 双尾临界 2.073873058由上表数据可以看出,双侧检验 P 值为 0.036

39、,小于指定显著性水平 0.05,故拒绝原假设,即样本数据表明新旧方法组装产品的劳动生产率不同。四、相关与回归1相关系数及说明2回归方程及预测12.已知 n=5,x=15,y=158, =55,xy=506, =51002x2y要求:(1)计算相关系数;(2)建立 y 依 x 的直线回归方程。解:(1)相关系数计算: 974.0)158(0)15(6)(222222 ynxnr(2)回归方程计算:b= = =3.222)(xny2)15(6a= = 3.2 =22by518直线回归方程为:y=22+3.2x13.为了研究企业生产费用与产品产量的关系,现从某一行业中随机抽取 12 家企业,所得资料

40、如下:企业编号 产量(千件)费用(千元)2x2yxy1 40 130 1600 16900 5200 140.9782 42 150 1764 22500 6300 141.81943 50 155 2500 24025 7750 145.1854 55 140 3025 19600 7700 147.28855 65 150 4225 22500 9750 151.49556 78 154 6084 23716 12012 156.96467 84 165 7056 27225 13860 159.48888 100 170 10000 28900 17000 166.229 116 167

41、 13456 27889 19372 172.951210 125 180 15625 32400 22500 176.737511 130 175 16900 30625 22750 178.84112 140 185 19600 34225 25900 183.048合计 1025 1921 101835 310505 170094要求:(1)计算产品产量与生产费用之间的简单相关系数,并说明其含义;设产品产量为 ,生产费用为 ,则xy920. 1923051251837094)()(2222nnxr说明产品产量与生产费用之间存在高度的正线性相关。(2)用最小平方法拟合生产费用对产品产量的回归直线,并解释回归系数的经济含义由最小平方法可以设立下列标准方程:2xbaxyn将上述数据代入方程得解如下: 15.240427.1907.8359ab可得生产费用对产品产量的回归方程为: xy.5回归系数 表示,产量每增加 1 千件,生产费用平均增长 0.4207 千元。4207b(3)根据所拟合的回归方程,预测当产量为 150 千件时的生产费用?千 元 )(26.18715.5.xyEXCEL 运行结果如下:

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报