1、实 验 报 告2013-2014 学年第 2 学期科目名称:管理统计学-基于 SPSS 软件应用指导老师: 谢 卓 班 级: 信息管理 1201 班 学 号: 12415400120 姓 名: 何婷 成 绩: 湖南工业大学 财经学院实 验 一【实验名称】:数据的整理和显示【实验时间】:201 年 4 月 4 日【实验目的】:1. 熟练数据整理方法2. 了解数据整理后展示方式【实验内容及要求】:用 SPSS 软件对某航空公司 38 名职员性别和工资情况的调查数据进行频次模块分析等。【实验过程及结果】:(1) 将数据文件按 income 和 gender 排名次。(2)对 gender 和 sal
2、ary 进行频次模块分析。统计量gender salary有效 38 38N缺失 0 0gender频率 百分比 有效百分比 累积百分比F 13 34.2 34.2 34.2M 25 65.8 65.8 100.0有效合计 38 100.0 100.0salary频率 百分比 有效百分比 累积百分比$16,950 1 2.6 2.6 2.6$21,150 1 2.6 2.6 5.3$21,450 1 2.6 2.6 7.9$21,750 1 2.6 2.6 10.5$21,900 2 5.3 5.3 15.8$24,000 2 5.3 5.3 21.1$26,250 1 2.6 2.6 23.
3、7$27,300 1 2.6 2.6 26.3$27,750 1 2.6 2.6 28.9$27,900 1 2.6 2.6 31.6$28,350 1 2.6 2.6 34.2有效$29,100 1 2.6 2.6 36.8$30,300 1 2.6 2.6 39.5$31,050 1 2.6 2.6 42.1$31,200 1 2.6 2.6 44.7$31,350 2 5.3 5.3 50.0$32,100 1 2.6 2.6 52.6$32,550 1 2.6 2.6 55.3$35,100 1 2.6 2.6 57.9$36,000 1 2.6 2.6 60.5$36,150 1 2
4、.6 2.6 63.2$38,850 1 2.6 2.6 65.8$40,200 1 2.6 2.6 68.4$40,800 1 2.6 2.6 71.1$42,000 1 2.6 2.6 73.7$42,300 1 2.6 2.6 76.3$45,000 1 2.6 2.6 78.9$46,000 1 2.6 2.6 81.6$57,000 1 2.6 2.6 84.2$60,375 1 2.6 2.6 86.8$81,250 1 2.6 2.6 89.5$92,000 1 2.6 2.6 92.1$103,750 1 2.6 2.6 94.7$110,625 1 2.6 2.6 97.4$
5、135,000 1 2.6 2.6 100.0合计 38 100.0 100.0(3)画出 salary/100(取整后)茎叶图【结果分析、体会和收获】:通过本次的学习,对 SPSS 有了初步的了解、对一些数据的导入、变量的设置以及简单的数据分析等基本操作已经熟练掌握;但还有很多不足,对于一些复杂的分析不能完全理解。不过我会慢慢的学习,是自己可以理解的透彻,并熟练的掌握。实 验 二【实验名称】:某年全国 31 个省、市、自治区的 GDP 数据分析大学生月平均生活费支出的调查数据【实验时间】:2014.04.11【实验目的】:求数据平均值、中位数、标准差、峰度、偏度、排序和检验置信区间【实验内容
6、及要求】:1、求出 GDP 的平均值、人均 GDP 的平均值、中位数、标准差、峰度、偏度、前五位及后五位的省份,并作出茎叶图、检验人均 GDP 的 95%的置信区间,根据得到的特征值对该年中国 GDP 和人均 GDP 情况作出简要分析陈述。2、根据 95的置信水平估计:全校本科学生平均月生活费支出的置信区间。得到求的均值为 3547.09682、人均 GDP 的平均值定义新变量人均 GDP计算变量:人均 GDP=GDP 值/人口3、求人均 GDP 的平均值、中位数、标准差、峰度和偏度在分析-描述统计 -描述里面在选项里面选中均值、标准差、峰度和偏度,点继续、确定所以中位数为0.64824、求出
7、人均 GDP 前五位及后五位的省份即对所有省份人均 GDP 进行排序点击确定,得到前五位的省份是后五位的省份是5、并作出茎叶图、检验人均 GDP 的95%的置信区间在分析-描述统计 -探索里面在统计量里人居 GDP 的茎叶图6 根据得到的特征值对该年中国 GDP 和人均 GDP 情况作出简要分析陈述。GDP 的值的高低并不决定人均 GDP 的高低,因为人均 GDP 等于 GDP 值除以人数,GDP 受人均 GDP 和人数共同作用。所以一个地区的 GDP 值很高 也不能说明该地的人均 GDP 很高。2、大学生日常生活费支出及生活费来源状况1根据 95的置信水平估计:全校本科学生平均月生活费支出的
8、置信区间。在分析-描述统计- 探索里面 ,得到【结果分析、体会和收获】:通过本次学习,在 SPSS 软件中认识到了求均值、中位数、平均数等一系列的应用,通过两次操作,更加深层了解 SPSS 软件。实验三一、实验目的与要求1.熟练掌握T检验的SPSS操作2.学会利用T检验方法解决身边的实际问题 二、实验原理1.假设检验的基本原理三、实验演示内容与步骤 1某项分析希望通过随机调查收集到的 26 家保险公司人员构成的数据(见数据文件:保险公司人员工程情况.sav) ,对保险公司从业人员受高等教育的程度和年轻化的程度进行推断。该分析的两个原假设为:(1)保险公司具有高等教育水平的员工比例的平均值不低于
9、 0.8,即H0:0.01,表明样本与正态分布没有显著差异2. 为检验某种新的训练方法是否有助于提高跳远运动员的成绩(见训练成绩.SAV) ,收集到 10 名跳远运动员在使用新训练方法前后的跳远最好成绩。这样得到了两个配对样本,在对总体分布不作任何假设的条件下,推断新方法训练前后是否存在显著差异。检验统计量 b训练后成绩 - 训练前成绩Z -1.599a渐近显著性(双侧) .110a. 基于负秩。b. Wilcoxon 带符号秩检验两个方法的p值都大于0.05,所以没有显著差异3.从甲乙两种不同工艺生产出来的产品中随机选取若干个观测数据(见产品使用寿命.SAV) ,分析两种工艺产品的使用寿命是
10、否存在显著差异?两个显著性概率 p 不都大于 0.05,所以存在显著差异实验五1、某企业在制定某商品的广告策略时,对不同广告形式在不同地区的广告效果(销售额)进行了评估, (见数据文件:广告城市与销售额.SAV) 。试以商品销售额为观测变量,广告形式和地区为控制变量,利用单因素方差分析分别对广告形式、地区对销售额的影响进行分析。读入数据后:(1)点击分析,比较均值,单因素分析;(2)得出结果:ANOVA销售额平方和 df 均方 F 显著性组间 5866.083 3 1955.361 13.483 .000组内 20303.222 140 145.023总数 26169.306 143有以上结果
11、可知:广告形式对于销售额是存在影响的。(4) 选择左框中的变量“销售额” ,用箭头送入右边的因变量列表中,选择左框中的变量“广告形式” ,用箭头送入右边的因子列表中;(5)得出结论:ANOVA销售额平方和 df 均方 F 显著性组间 9265.306 17 545.018 4.062 .000组内 16904.000 126 134.159总数 26169.306 143地区对于销售额也是有影响的。对上题进行双因素分析(包括无重复和有重复)无重复双因素分析:操作如下:(1)点击分析,一般线性模型,单变量;(2)将销售额移入因变量,广告形式移入固定因子,地区移入随机因子;(3)点击模型,弹出窗口
12、后点击设定来自定义,选择类型为交互,将广告形式、地区移入右边;(4)得出结果:主体间效应的检验因变量:销售额源 III 型平方和 df 均方 F Sig.假设 642936.694 1 642936.694 1179.661 .000截距误差 9265.306 17 545.018a假设 5866.083 3 1955.361 21.789 .000广告形式误差 11037.917 123 89.739b假设 9265.306 17 545.018 6.073 .000地区误差 11037.917 123 89.739ba. MS(地区)b. MS(错误 )3、某补习机构为研究一个班 3 组不
13、同性别的同学(分别接受了 3 种不同的教学方法)在数学成绩上是否有显著差异,需要研究不同教学方法和不同性别对数学成绩的影响。数据如表所示。表三组不同性别学生的数学成绩人名 数学 组别 性别Hxh 99 0 MaleYaju 88 0 FemaleYu 99 0 MaleShizg 89 0 MaleHah 94 0 FemaleS 90 0 MaleWatet 79 2 MaleJess 56 2 FemaleWish 89 2 Male2-new1 99 2 Male2-new2 70 2 Female2-new3 89 2 Male2-new4 55 1 Female2-new5 50 1
14、 Male2-new6 67 1 Female2-new7 67 1 Male2-new8 56 1 Female2-new9 56 1 Male试进行方差分析性别和教学方法是否对数学成绩影响显著,说明过程及理由。(4)得出结论:主体间效应的检验因变量:数学源 III 型平方和 df 均方 F Sig.假设 99641.101 1 99641.101 306.037 .038截距误差 321.132 .986 325.585a假设 3290.333 2 1645.167 18.516 .000组别误差 1243.927 14 88.852b假设 319.740 1 319.740 3.599
15、.079性别误差 1243.927 14 88.852ba. 1.025 MS(性别) - .025 MS(错误)b. MS(错误)有结果可知:第六列表示的是 F 统计量的显著性水平。由此可知,性别对成绩的影响是显著的,组别对成绩的影响是不显著的。实 验 六【实验名称】:普通相关分析【实验时间】:2013 年 5 月 20 日【实验目的】:1.熟练掌握普通相关分析的SPSS操作2.学会利用普通相关分析方法解决身边的实际问题 【实验内容及要求】:1.某班级学生高等数学和统计学期末考试成绩如表所示,现要研究该班学生的高等数学和统计学成绩之间是否具有相关性,根据数据散点图及相关分析运算结果进行分析。
16、2.某专家先后对一个工程的多个项目加以评分,两次评分分别记为变量“分值 1”和“分值2”,如下表所示。问两次评分的等级相关有多大,是否达到显著水平作出分析。3.某农业实验场通过试验取得小麦产量与单位虫害值和平均温度的数据,如下表所示。求单位虫害值对产量的偏相关(剔除温度变量的影响) ,作简要分析。【实验过程及结果】:一数据散点图及相关分析运算结果进行分析。相关性高等数学 统计学Pearson 相关性 1 .775*显著性(双侧) .000高等数学N 18 18Pearson 相关性 .775* 1显著性(双侧) .000统计学N 18 18*. 在 .01 水平(双侧)上显著相关。t统计量的值
17、的显著性概率p=0.0000.05,说明剔除温度色影响后,单位害虫值对产量没有显著性关系。【结果分析、体会和收获】:通过本次试验熟练掌握了用 spps 对两个或多个随机变量的线性相关关系,我们可以先通过散点图对关系进行简单判断,然后再通过数据的具体分析作出进一步判断。实验七【实验名称】:用 SPSS 处理经典回归问题【实验时间】:2014 年 5 月 16 日【实验目的】:学习如何运用 SPSS 处理经典回归问题【实验内容及要求】:用 SPSS 处理经典回归问题来 考察中国城镇居民2011 年人均可支配收入与消费支出之间的关系【实验过程及结果】:(1)画散点图(2)判断人均可支配收入与消费支出
18、之间是否大致呈线性关系输入移去的变量 b模型 输入的变量 移去的变量 方法1 消费支出Y a . 输入a. 已输入所有请求的变量。b. 因变量: 可支配收入X模型汇总模型R R 方 调整 R 方标准 估计的误差1 .986a .971 .970 413.04952a. 预测变量: (常量), 消费支出Y。Anovab模型 平方和 df 均方 F Sig.回归 1.675E8 1 1.675E8 981.703 .000a残差 4947687.223 29 170609.9041总计 1.724E8 30a. 预测变量: (常量), 消费支出Y。b. 因变量: 可支配收入X系数 a非标准化系数
19、标准系数模型B 标准 误差 试用版 t Sig.(常量) 256.469 270.434 .948 .3511消费支出Y .717 .023 .986 31.332 .000a. 因变量: 可支配收入X结果分析表1中显示的是拟合过程中变量输入/移去模型的情况记录,由于只引入了一个自变量,所以只出现一个模型1,该模型中“消费支出Y”为进入的变量,没有移除的变量,具体的输入/移去方法为输入。表2是模型拟合概述, 列出了模型的R、R 2 、调整R 2 及估计标准误。R 2 值越大所反映的两变量的共变量比率越高,模型与数据的拟合程度越好。本题所用数据拟合结果显示:R(所考察的自变量和因变量之间的相关系
20、数)= 0.986 ,R 2(拟合线性回归的决定系数)= 0.971 ,经调整后的R 2=0.970,标准误的估计= 413.04952 。表3方差分析表, 列出了变异源、自由度、均方、F值及对F的显著性检验。本题中回归方程显著性检验结果表明:回归平方和为1.675E8,残差平方和为 4964787.223 ,总平方和为 1.724E8 ,对应的F统计量的值为 981.703 , Sig=0.000= .100)。2 Z4 . 步进(准则: F-to-enter 的概率 = .100)。a. 因变量: 满意度模型汇总更改统计量模型R R 方 调整 R 方标准 估计的误差 R 方更改 F 更改
21、df1 df2 Sig. F 更改1 .486a .236 .213 2.98315 .236 10.499 1 34 .0032 .583b .340 .300 2.81436 .104 5.201 1 33 .029a. 预测变量: (常量), Z8。b. 预测变量: (常量), Z8, Z4。Anovac模型 平方和 df 均方 F Sig.回归 93.428 1 93.428 10.499 .003a残差 302.572 34 8.8991总计 396.000 35回归 134.620 2 67.310 8.498 .001b残差 261.380 33 7.9212总计 396.000
22、 35a. 预测变量: (常量), Z8。b. 预测变量: (常量), Z8, Z4。c. 因变量: 满意度系数 a非标准化系数 标准系数 B 的 95.0% 置信区间 相关性模型B 标准 误差 试用版 t Sig. 下限 上限 零阶 偏 部分(常量) 20.999 .793 26.483 .000 19.387 22.6101Z8 .139 .043 .486 3.240 .003 .052 .227 .486 .486 .486(常量) 12.756 3.691 3.456 .002 5.246 20.2652Z8 .117 .042 .408 2.804 .008 .032 .202 .486 .439 .397