1、SPSS 统计软件期末复习题答案1. 某单位对 100 名女生测定血清总蛋白含量,数据如下:74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 71.2 73.579.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 71.2 72.075.0 73.5 78.8 74.3 75.8 65.0 74.3 71.2 69.7 68.073.5 75.0 72.0 64.3 75.8 80.3 69.7 74.3 73.5 73.575.8 75.8 68.8 76.5 70.4 71.2 81.2 75.0 70.4 68.070.4 72.0
2、 76.5 74.3 76.5 77.6 67.3 72.0 75.0 74.373.5 79.5 73.5 74.7 65.0 76.5 81.6 75.4 72.7 72.767.2 76.5 72.7 70.4 77.2 68.8 67.3 67.3 67.3 72.775.8 73.5 75.0 73.5 73.5 73.5 72.7 81.6 70.3 74.373.5 79.5 70.4 76.5 72.7 77.2 84.3 75.0 76.5 70.4计算样本均值、中位数、方差、标准差、最大值、最小值、极差、偏度和峰度,并给出均值的置信水平为 95%的置信区间。2. 绘出习题
3、1 所给数据的直方图、盒形图和 QQ 图,并判断该数据是否服从正态分布。3. 正常男子血小板计数均值为 92510/L, 今测得 20 名男性油漆工作者的血小板计数值(单位: 910/L)如下:220 188 162 230 145 160 238 188 247 113126 245 164 231 256 183 190 158 224 175问油漆工人的血小板计数与正常成年男子有无异常? 4. 在某次考试中,随机抽取男女学生的成绩各 10 名,数据如下:男:99 79 59 89 79 89 99 82 80 85 女:88 54 56 23 75 65 73 50 80 65假设总体服
4、从正态分布,比较男女得分是否有显著性差异。5. 通过随机抽样,抽取了 A、B 两组被试,施以不同的教学方法( A 组采用的教学方法为启发讨论式,B 组采用的教学方法练习总结式),期末考试成绩如下:A 组: 119,110 ,132,106,121,120B 组: 133,128 ,130,134,129,136,133假设两总体服从正态分布,为检验教学方法的效果有无显著差异,请建立数据文件A4(变量名分别为教学方法(A 组教学方法的取值为 1,其值标签为启发讨论, B 组的教学方法取值为 2,其值标签为练习总结式)、成绩)并选择独立样本 t 检验法计算 t检验统计量的值,将结果报表保存为 A4
5、-1。6. 设有 5 种治疗荨麻疹的药,要比较它们的疗效。假设将 30 个病人分成 5 组,每组 6 人,令同组病人使用一种药,并记录病人从使用药物开始到痊愈所需时间,得到下面的记录:药物类别 治愈所需天数1 5,8,7,7,10,82 4,6,6,3,5,63 6,4,4,5,4,34 7,4,6,6,3,55 9,3,5,7,7,6问所有药物的效果是否一样? 7. 某集团公司将进行薪酬改革,目前员工的工资表如下(表 1) 。为了了解来自不同下属公司、不同工作性质的员工收入状况,及对工资态度。以便为决策者制定合理的薪酬体系提供科学依据,请分析以下问题: 表 1 : 工资表员工 态度 工资 工
6、作性质 公司1 满意 2845 一般员工 22 不满意 2871 一般员工 23 很满意 2750 一般员工 14 不满意 4188 经理 25 不满意 4612 经理 16 满意 5212 经理 17 满意 6177 经理 28 满意 2137 管理人员 29 满意 1965 管理人员 210 很满意 2235 管理人员 111 很满意 2340 一般员工 112 不满意 2435 一般员工 213 很满意 3135 管理人员 114 满意 2235 管理人员 215 不满意 3000 一般员工 116 满意 4600 经理 2分析内容:1数据文件描述:变量名、变量类型、值标签、测度水平(5
7、 分)2计算员工工资的标准化值 (5 分)3如果工资需要交税,实际工资=工资*(1-税率) 。税率分别为:工资3000,税率=15%;3000工资5000,税率=20%;工资5000,税率=30%。不同工作性质的员工的实际工资的平均值、标准差,并指出哪些编号员工的实际工作判断是奇异值或异常值?(15 分)4运用多维交叉表分析,判断不同工作性质的员工与工资态度是否存在相关性?(10 分)5不同公司的员工工资是否有显著差异(10)8. 入户推销有五种方法。某大公司想比较这五种方法有无显著的效果差异,设计了一项实验。从尚无推销经验的应聘人员中随机挑选一部分,并随机地将他们分为五个组,每组用一种推销方
8、法培训。一段时期后得到他们在一个月内的推销额,如下表所示:第一组 20.0 16.8 17.9 21.2 23.9 26.8 22.4第二组 24.9 21.3 22.6 30.2 29.9 22.5 20.7第三组 16.0 20.1 17.3 20.9 22.0 26.8 20.8第四组 17.5 18.2 20.2 17.7 19.1 18.4 16.5第五组 25.2 26.2 26.9 29.3 30.4 29.7 28.31.利用单因素方差分析方法分析这五种推销方式是否存在显著差异。2.绘制各组的均值对比图,并利用 LSD 方法进行多重比较检验,说明那组推销方式最好?9. 已知我国
9、 2003 年部分地区城镇居民人均可支配收入和人均消费性支出如下表所示:(单位:元)(1)绘制城镇居民人均可支配收入与人均消费性支出的相关图(散点图) ;(2)利用相关系数分析城镇居民人均可支配收入与人均消费性支出之间的关系?(3)如果有相关关系,建立一元线性回归模型,解释输出结果。并预测当人均可支配收入为 8000 时的人均消费性支出。地 区人均消费性支出(Y)人均可支配收入(X)地 区人均消费性支出( Y)人均可支配收入(X)北京 11123.8 13882.6 湖北 5963.3 7322天津 7867.5 10312.9 湖南 6082.6 7674.2河北 5439.8 7239.1
10、 广东 9636.3 12380.4山西 5105.4 7005 广西 5763.5 7785内蒙古 5419.1 7012.9 海南 5502.4 7259.3辽宁 6077.9 7240.6 重庆 7118.1 8093.7吉林 5492.1 7005.2 四川 5759.2 7041.9黑龙江 5015.2 6678.9 贵州 4949 6569.2上海 11040.3 14867.5 云南 6023.6 7643.6江苏 6708.6 9262.5 西藏 8045.3 8765.5浙江 9712.9 13179.5 陕西 5666.5 6806.4安徽 5064.3 6778 甘肃 5
11、298.9 6657.2福建 7356.3 9999.5 青海 5400.2 6745.31. 计算样本均值、中位数、方差、标准差、最大值、最小值、极差、偏度和峰度,并给出均值的置信水平为 95%的置信区间。 定义 1 个变量为:“血清总蛋白含量 ”,其度量标准为“ 度量” 。选择菜单“分析 描述统计 探索” ,打开“探索” 对话框,将“血清总蛋白含量”字段移入“因变量列表” 。打开“统计量”对话框,选中“描述性”选项 95%置信区间;打开“绘制”对话框,选中“按因子水平分组” 、 “茎叶图” 、 “带检验的正态图” 、 “直方图”等选项。打开“选项” ,选中“按列表排除个案”选项。2. 绘出
12、习题 1 所给数据的直方图、盒形图和 QQ 图,并判断该数据是否服从正态分布。表中显示了血清总蛋白含量的两种检验方法的正态性检验结果,包括各分组的统计量、自由度及显著性水平,以 K-S 方法的分析:其自由度 sig.=0.200,明显大于 0.05,故应接受原假设,认为题中数据服从正态分布。3. 问油漆工人的血小板计数与正常成年男子有无异常? 分析:这是一个典型的比较样本均值和总体均值的 T 检验问题 ;第 1 步 数据组织:首先建立 SPSS 数据文件,只需建立一个变量 “血小板计数” ,录入相应的数据即可 第 2 步 单样本 T 检验分析设置 选择菜单“分析比较均值单样本 T 检验(S )
13、 ”,打开 “单样本 T 检验” 对话框,将变量“血小板计数”移入“检验变量”列表框,并输入检验值 225;打开“单样本 T检验:选项”对话框 ,设置置信区间为 95%(缺省为 95%)。本例置信水平为 95%,显著性水平为 0.05,从上表中可以看出,sig 值为 0.003,小于 0.05,故原假设不成立,也就是说,男性油漆工作者的血小板与 922510/L 有显著性差异,无理由相信油漆工人的血小板计数与正常成年男子无异常。4. 假设总体服从正态分布,比较男女得分是否有显著性差异。第 1 步 数据组织: 在 SPSS 数据文件中建立两个变量,分别为“性别” 、 “成绩” ,度量标准分别为“
14、名义” 、“度量” ,变量“性别”的值标签为:b男生,g女生,录入数据。 第 2 步 独立样本 T 检验设置: 选择菜单“选择比较均值独立样本 T 检验” ,打开“独立样本 T 检验”对话框,将“成绩”作为要进行 T 检验的变量,将“性别”字段作为分组变量,定义分组变量的两个分组分别为“b”和“g” 。打开“独立样本 T 检验:选项”对话框,设置置信区间为 95%(缺省为 95%)。根据上表“方差方程的 Levene 检验”中的 sig.为 0.221,远大于设定的显著性水平 0.05,故本例两组数据方差相等。在方差相等的情况下,独立样本 T 检验的结果应该看上表中的“假设方差相等”一行,第
15、5 列为相应的双尾检测概率( Sig.(双侧) )为 0.007,在显著性水平为 0.05 的情况下,T 统计量的概率 p 值小于 0.05,故应拒绝零假设, ,即认为两样本的均值不是相等的,在本例中,能认为男女成绩有显著性差异。5. 假设两总体服从正态分布,为检验教学方法的效果有无显著差异,请建立数据文件A4(变量名分别为教学方法(A 组教学方法的取值为 1,其值标签为启发讨论,B 组的教学方法取值为 2,其值标签为练习总结式) 、成绩)并选择 独立样本 t 检验法计算 t检验统计量的值,将结果报表保存为 A4-1。第 1 步 数据组织: 建立两个变量,分别为“教学方法” 、 “成绩” ,度
16、量标准分别为“名义” 、 “度量” ,变量“教学方法”的值标签为:1启发讨论,2 练习总结式,录入数据。第 2 步 独立样本 T 检验设置: 选择菜单“选择比较均值独立样本 T 检验” ,打开“独立样本 T 检验”对话框,将“成绩”作为要进行 T 检验的变量,将“教学方法”字段作为分组变量,定义分组变量的两个分组分别为“1”和 “2”。打开“独立样本 T 检验:选项”对话框,设置置信区间为 95%(缺省为 95%)。6. 问所有药物的效果是否一样? 第 1 步 分析: 由于考虑的是一个控制变量(药物)对一个观测变量(治愈所需天数)的影响,而且是五种药物,所以不适宜用独立样本 T 检验(仅适用两
17、组数据) ,应采用单因素方差分析。 第 2 步 组织数据: 建立两个变量,一个变量名为“治愈所需天数” ,另一变量名为“药物种类” (变量值分别为 1、2 、3 、4、5) ,输入数据。 第 3 步 方差相等的齐性检验: 选择菜单“选择比较均值单因素 ANOVA”,打开“单因素 ANOVA”对话框,将“治愈所需天数”作为因变量, “药物种类”作为因子;打开“两两比较”对话框,选中 LSD;打开 “选项”对话框,勾选方差同质性检验和均值图,点击“确定” 。方差齐性检验的 H0 假设是:方差相等。从上表可看出相伴根据Sig.=0.699(0.05 )说明应该接受 H0 假设(即方差相等) 。故下面
18、就用方差相等的检验方法。由于组间比较的相伴概率 Sig.(p 值)=0.0140.05,故应拒绝 H0 假设(四种饲料喂猪效果无显著差异) ,说明五种药物对治愈所需天数有显著性差异。从整个表反映出来五种药物相互之间均存在显著性差异,从效果来看是第 3 种最好,其次是第 2 种,第 1 种最差。7. (1)数据文件描述:变量名、变量类型、值标签、测度水平名称 类型 值 度量标准 姓名 字符 名义 态度 数值 1=很满意,2= 满意,3=不满意 序号 工资 数值 度量 工作性质 数值 1=经理,2= 管理人员,3=一般员工 序号/名义 下属公司 数值 1=分公司 1,2=分公司 2 名义 (2 )
19、计算员工工资的标准化值分析 描述统计 描述,将“工资”变量移入变量框,选中“将标准化得分另存为变量” ,点击“确定” 。(3 )如果工资需要交税,实际工资= 工资*(1-税率) 。税率分别为:工资 3000,税率=15% ;3000工资5000,税率=20%;工资5000,税率=30%。不同工作性质的员工的实际工资的平均值、标准差,并指出哪些编号员工的实际工作判断是奇异值或异常值?计算岗位工资:转换 计算变量,在目标变量框输入新变量“岗位工资” ,在数字表达式框输入表达式:工资*1.1,点击“如果” ,选中“如果个案满足条件则包括” ,输入表达式:工资性质=3,点击“继续” ,点击“确定” 。
20、管理人员和经理的岗位工资操作同上。计算税率:转换 计算变量,在目标变量框输入新变量“税率” ,在数字表达式框输入具体值:0.15,点击“如果” ,选中“如果个案满足条件则包括” ,输入:工资 = 3000,点击 “继续” ,点击“确定” 。其它两级工资的操作同上。计算实际工资:转换 计算变量,在目标变量框输入新变量“实际工资” ,在数字表达式框输入表达式:岗位工资 * (1-税率),点击“确定” 。选择菜单“分析 描述统计 描述” ,打开“描述”对话框,将“实际工资”字段移入“变量列表” ;打开“选项”对话框,勾选均值、标准差,点击“确定” 。(4 )运用多维交叉表分析,判断不同工作性质的员工
21、与工资态度是否存在相关性?(5 )不同公司的员工工资是否有显著差异选择菜单“选择比较均值独立样本 T 检验” ,打开“独立样本 T 检验”对话框,将“工资”作为要进行 T 检验的变量,将“下属公司”字段作为分组变量,定义分组变量的两个分组分别为“1”和 “2”。打开“独立样本 T 检验:选项”对话框,设置置信区间为 95%(缺省为 95%)。8. (1)利用单因素方差分析方法分析这五种推销方式是否存在显著差异。(2)绘制各组的均值对比图,并利用 LSD 方法进行多重比较检验,说明那组推销方式最好?第 1 步 数据组织: 建立两个变量,分别为“推销方式” 、 “销售额” ,度量标准分别为“名义”
22、 、 “度量” ,变量“推销方式”的值标签为:1、2 、3、4 、5,录入数据。第 2 步 单因素方差分析:选择菜单“选择比较均值单因素 ANOVA”,打开“单因素 ANOVA”对话框,将“销售额”作为因变量, “推销方式”作为因子;打开“两两比较”对话框,选中LSD;打开“选项 ”对话框,勾选方差同质性检验和均值图,点击“确定” 。分析表 2:sig 值为 0.000.05,故拒绝原假设,认为这五种销售方式中存在显著差异。分析表 3:可以看出,多重比较中 sig 值均小于 0,05,所以拒绝原假设,认为五种推销方法存在显著差异。均值图也可以看出均值对比图的曲折比较大,进一步验证了结论。9.
23、(1)绘制城镇居民人均可支配收入与人均消费性支出 的相关图(散点图) ;选择菜单“图形图表构建程序” ,打开“图表构建程序”对话框,选择“散点图简单散点图” ,将 XY 轴拖入,点击“确定” 。(2 )利用相关系数分析城镇居民人均可支配收入与人均消费性支出之间的关系?选择菜单“分析相关双变量” ,打开“双变量”对话框,拖入变量 XY,单击“确定”。(3 )如果有相关关系,建立一元线性回归模型,解释输出结果。并预测当人均可支配收入为 8000 时的人均消费性支出。系数 a非标准化系数 标准系数模型 B 标准 误差 试用版 t Sig.(常量) 354.693 294.520 1.204 .240
24、1(X) .739 .033 .976 22.169 .000a. 因变量: (Y)Y=354.693+0.739X 意味着人均可支配收入 X 每增加一个单位,就会使人均消费性支出Y 增加 0.739 个单位。当 X=8000 时,Y=6266.693书是我们时代的生命 别林斯基书籍是巨大的力量 列宁书是人类进步的阶梯 高尔基书籍是人类知识的总统 莎士比亚书籍是人类思想的宝库 乌申斯基书籍 举世之宝 梭罗好的书籍是最贵重的珍宝 别林斯基书是唯一不死的东西 丘特书籍使人们成为宇宙的主人 巴甫连柯书中横卧着整个过去的灵魂 卡莱尔人的影响短暂而微弱,书的影响则广泛而深远 普希金人离开了书,如同离开空气一样不能生活 科洛廖夫书不仅是生活,而且是现在、过去和未来文化生活的源泉 库法耶夫书籍把我们引入最美好的社会,使我们认识各个时代的伟大智者史美尔斯书籍便是这种改造灵魂的工具。人类所需要的,是富有启发性的养料。而阅读,则正是这种养料 雨果