1、重庆工商大学数学与统计学院实验报告实验课程: 统计学实验 指导教师: 叶 勇 专业班级: 14 信管_ 学生姓名: _安琪_ _学生学号:2014033109_2实 验 报 告实验项目实验三 统计数据的描述 实验四 长期趋势和季节变动测定实验日期2016.5.3 实验地点 80608实验目的1、熟练掌握各种描述统计指标对应的函数 2、掌握运用“描述统计”工具进行描述统计的方法,对结果能进行解释 3、掌握测定长期直线趋势的方法 4、掌握测定季节变动的方法实验内容1、 统计学实验教材第三章第(1)题。2、联合食品公司为了了解客户的支付方式和金额,作了抽样调查并得到 100个客户的样本资料如下:现金
2、支付 个人支票 信用卡支付 现金支付 个人支票 信用卡支付7.40 27.60 50.30 5.80 52.87 69.775.51 30.60 33.76 20.48 78.16 48.114.75 41.58 25.57 16.28 25.9615.10 36.09 46.42 15.57 31.078.81 2.67 46.13 6.93 35.381.85 34.67 14.44 7.17 58.117.41 58.64 43.79 11.54 49.2111.77 57.59 19.78 13.09 31.7412.07 43.14 52.35 16.69 50.589.00 21.
3、11 52.63 7.02 59.785.98 52.04 57.55 18.09 72.467.88 18.77 27.66 2.44 37.945.91 42.83 44.53 1.09 42.693.65 55.40 26.91 2.96 41.1014.28 48.95 55.21 11.17 40.511.27 36.48 54.19 16.38 37.202.87 51.66 22.59 8.85 54.844.34 28.58 53.32 7.22 58.753.31 35.89 26.57 17.8715.07 39.55 27.89 69.22要求:(1)利用公式法计算各种支
4、付方式对应的支付金额的平均数和标准差;(2)利用“描述统计”工具计算各种支付方式对应的支付金额的平均数和标准差;(3)对得到的结果进行简要的解释。3、某大学的学生为了了解该校学生使用电脑的情况,随机抽取了 30名女生和 30名男生,数据见下表。5性别 每周使用电脑时间 其中上网时间 使用电脑用途 性别 每周使用电脑时间 其中上网时间 使用电脑用途女 20 20 CE 男 5 3.5 ACE女 8 6 CDE 男 30 10 ABCE女 25 25 CDE 男 20 5 BCE女 18 18 ABE 男 15 0 B女 10 8 ACD 男 5 5 C女 5 5 D 男 20 19 BCE女 6
5、 3 CDE 男 7 4 ACDE女 4 3 AC 男 20 20 BCEF女 2 2 D 男 5 4.5 AC女 2 2 DE 男 15 10 ACE女 14 14 CD 男 20 5 ACEF女 12 10 CDE 男 10 9 CD女 8 7 CD 男 5 4.5 CD女 15 15 CDE 男 7 4 BCD女 15 12 CE 男 5 3 CD女 20 20 BCE 男 20 20 BC女 10 10 CD 男 5 5 ACD女 2 1 DE 男 30 15 BCE女 6 4 ACE 男 25 5 BCE女 10 8 ACE 男 20 18 BCF女 10 4 CDEF 男 30 2
6、0 ACE女 10 8 ACD 男 20 10 DF女 12 10 CDE 男 10 8 AC女 5 5 D 男 14 12 BD女 5 5 CD 男 15 10 ADF女 10 3 AC 男 18 15 BE女 20 20 CDE 男 10 8 AC女 4 3 AE 男 16 12 ABF女 3 1 ACF 男 10 7 DF女 14 8 ACE 男 15 14 CD其中,在使用电脑用途中,各符号的含义为:A:写论文等作业 B:游戏 C:聊天(qq) 、写邮件 D:浏览信息、新闻、书籍 E:听歌、看电影 F:学习各种软件的使用要求:试运用描述统计方法,对该校学生使用电脑的情况作简要分析,写出
7、分析报告。4.某企业 2004-2015年的各年产量数据如下表(单位:万件)年份 2004 2005 2006 2007 2008 2009产量 100 95 98 107 110 105年份 2010 2011 2012 2013 2014 2015产量 107 115 123 115 120 125绘制时间序列图描述其趋势。用 3年移动平均法计算移动平均值。5.查找并填充下列表格中的重庆市 1985-2014年粮食产量数据。6年份 粮食产量(万吨) 年份 粮食产量(万吨)1985 948.97 2000 1131.211986 1004.92 2001 1035.351987 1004.5
8、1 2002 1082.151988 958.02 2003 1087.201989 1044.88 2004 1144.571990 1085.07 2005 1168.191991 1115.28 2006 910.501992 1050.24 20071993 1052.72 20081994 1134.10 20091995 1153.68 20101996 1172.14 20111997 1184.63 20121998 1155.36 20131999 1143.05 2014要求:绘制时间序列图描述其趋势。采用两种方法选择一条合适的趋势线拟合数据,并根据趋势线预测 2015年的
9、粮食产量。备注:粮食产量数据查询页面。76.下表是一家啤酒生产企业 2007-2012年各季度的啤酒销售量数据。季度年份一 二 三 四2007 25 32 37 262008 30 38 42 302009 29 39 50 352010 30 39 51 372011 29 42 55 382012 31 43 54 41要求:判断该时间数列是否受长期趋势的影响。计算各季度的季节指数。评分项目 得分实验内容完整实验步骤完整、清楚实验方法正确实验结果完整、清楚、合理总分实验过程、结果及结果分析1.第一步,将数据和要求的相应数值的名称输入 Excel表格中。数据区域是“A1:J4” ,名称区域是
10、“K2:K9” 。第二步,单击单元格 L2,在“插入”菜单中选择“函数”项,从弹出对话框左侧“函数分类”列表中选择“统计” ,从右侧“函数名” 列表中选择 MEDIAN函数,点击“确定”按钮。第三步,填写对话框,在数据区域 number1填写“A1:J4” ,点击“确定”按钮。就可以得出中位数。其他数值的求法同上。(算术平均数、众数、最大值、最小值、四分位差、样本标准差、样本方差对应的函数名称分别是 AVERAGE、MODE、MAX、MIN、QUARTILE、STDEV、VAR),最终求得的结果如下:中位数 72.5算术平均数 72.45众数 78最大值 98最小值 45四分位差 14.5样本
11、标准差 11.59786样本方差 134.51032.(1)第一步,将表格复制到 Excel表格中,并进行整理。第二步,单击单元格 G2,在“插入”菜单中选择“函数”项,从弹出对话框左侧“函数分类”列表中选择“统计” ,从右侧“函数名” 列表中选择 AVERAGE函数,点击“确定”按钮。第三步,填写对话框,在数据区域 number1填写“A2:A39” ,点击“确定”按钮。就可以得12出现金支付的平均数。第四步,单击单元格 G3,在“插入”菜单中选择“函数”项,从弹出对话框左侧“函数分类”列表中选择“统计” ,从右侧“函数名” 列表中选择 STDEV函数,点击“确定”按钮。第五步,填写对话框,
12、在数据区域 number1填写“A2:A39” ,点击“确定”按钮。就可以得出现金支付的标准差。计算个人支付和信用卡支付的平均数和标准差的步骤同上,最后得到的结果如下:现金支付 个人支票 信用卡支付平均数 8.868421053 42.732 40.885标准差 5.260687205 15.62186046 14.87695589(2)第一步,在“工具”菜单中单击“数据分析”选项,选择“描述统计” 。第二步,回车进入“描述统计”对话框,在“输入区域”中输入“A2:A39” ,在分组方式后选择“逐列”在“输出区域”框中输入 F6.根据需要选择“汇总统计” 。第三步,单击“确定” ,即在指定区域
13、输出结果。第四步,对得到的数据进行整理。计算个人支付和信用卡支付的平均数和标准差的步骤同上,最后得到的结果如下:现金支付 个人支票 信用卡支付平均 8.868421053 42.732 40.885标准误差 0.853396155 2.470033016 3.171777654中位数 7.405 41.34 45.33标准差 5.260687205 15.62186046 14.87695589方差 27.67482987 244.0425241 221.3238167峰度 -0.841915879 0.266624632 -1.001660772偏度 0.43043075 -0.033009
14、748 -0.118845468区域 19.39 75.49 55.33最小值 1.09 2.67 14.44最大值 20.48 78.16 69.77求和 337 1709.28 899.47观测数 38 40 22(3) “平均”指样本平均值,38 名用现金支付的顾客支付的平均金额为 8.868421053;40 名用个人支票的顾客支付的平均金额为 42.732;22 名用信用卡支付的顾客支付的平均金额为40.885。“标准差”是样本标准差,表示以 38名用现金支付的顾客为样本,支付金额的标准差为 5.260687205;以 40名用个人支票的顾客为样本,支付金额的标准差为15.62186
15、046;以 22名用信用卡支付的顾客为样本,支付金额的标准差为 14.87695589。由此可知,被调查者倾向于个人支票支付和信用卡支付,支付金额灵活,现金支付方式大多适用于小金额支付。123. (1)运用数据分析的描述统计,可以分别得出男生和女生每周使用电脑时间和其中上网时间的一些相关数据,结果如下:基本数据对比女生每周使用电脑时间 其中上网时间 平均 10.1667 平均 8.666667标准误差 1.127589 标准误差 1.200894中位数 10 中位数 7.5众数 10 众数 8标准差 6.176057 标准差 6.577565方差 38.14368 方差 43.26437峰度
16、-0.3217 峰度 0.001709偏度 0.611292 偏度 0.959403区域 23 区域 24最小值 2 最小值 1最大值 25 最大值 25求和 305 求和 260观测数 30 观测数 30最大(1) 25 最大(1) 25最小(1) 2 最小(1) 1男生每周使用电脑时间 其中上网时间 平均 14.9 平均 9.516666667标准误差 1.43387 标准误差 1.060655656中位数 15 中位数 8.5众数 20 众数 5标准差 7.85362 标准差 5.809450288方差 61.6793 方差 33.74971264峰度 -0.6731 峰度 -0.791
17、612144偏度 0.38438 偏度 0.554409283区域 25 区域 20最小值 5 最小值 0最大值 30 最大值 20求和 447 求和 285.5观测数 30 观测数 30最大(1) 30 最大(1) 20最小(1) 5 最小(1) 0置信度(95.0%) 2.93259 置信度(95.0%) 2.16928435612(2)用途范围对比女生用途数 学生数 百分比1 3 10.00%2 11 36.67%3 15 50.00%4 1 3.33%男生用途数 学生数 百分比1 2 6.67%2 12 40.00%3 12 40.00%4 4 13.33%(3)用途对比女生用途 人数
18、 百分比A:写论文等作业 10 13.51%B:游戏 2 2.70%C:聊天(qq)、写邮件 23 31.08%D:浏览信息、新闻、书籍 19 25.68%E:听歌、看电影 18 24.32%F:学习各种软件的使用 2 2.70%74男生用途 人数 百分比A:写论文等作业 12 15.38%B:游戏 13 16.67%C:聊天(qq)、写邮件 23 29.49%D:浏览信息、新闻、书籍 11 14.10%E:听歌、看电影 12 15.38%F:学习各种软件的使用 7 8.97%78由上述对比可以得出以下结论:(1)该校女生每周平均使用电脑时间和其中上网时间均比男生要少。女生平均使用电脑时间是
19、10.17小时,男生为 14.9小时;女生平均上网时间约为 8.67小时,男生为 9.52小时。(2)该校女生每周使用电脑时间差异及其上网时间差异均大于男生。(3)不管是男生还是女生,使用电脑来做 2-3种事情的人数最多;并且有较多的人经常使用电脑来聊天(QQ)、写邮件。12(4)对女生来说,她们很少用电脑玩游戏和学习各种软件的使用;对男生来说,他们很少用电脑学习各种软件的使用。4.(1)第一步,选择“插入”菜单的“图表”子菜单,进入图表向导第二步,选择“图表类型”为“XY 散点图” ,然后单击下一步第三步,显示的对话框为“图表向导4 步骤之 2”,填写图表源数据之数据区域对话框,在“数据区域
20、”中输入 A1:B13,选择图表系列产生在 “列”第四步,单击“下一步” ,出现“图表向导4 步骤之 3”页面,在图表标题中输入“某企业2004-2015年的各年产量时间序列图”第五步,单击下一步,选择图表输出的位置,然后单击完成按钮,结果如下图某 企 业 2004-2015年 的 各 年 产 量 时 间 序 列 图0204060801001201402002 2004 2006 2008 2010 2012 2014 2016产 量(2)第一步,单击“工具”菜单中的“数据分析”选项,在其对话框“分析工具”列表中选择“移动平均” ,单击“确定” ,进入移动平均对话框。第二步,选定产量数据为输入
21、区域,间隔填:3,表示三项平均,点击确定按钮输出数据年份 产量 移动平均值2004 1002005 95 97.6666672006 98 1002007 107 1052008 110 107.333332009 105 107.333332010 107 1092011 115 1152012 123 117.666672013 115 119.333332014 120 1202015 125分析:由图表和数据可以分析出,该企业产量具有较强的长期趋势,呈逐年上升状态。5. 年份 粮食产量(万吨) 年份 粮食产量(万吨)2007 1088 2011 1126.90322008 1153.2
22、 2012 1138.5449122009 1137.2 2013 1148.12972010 1156.13 2014 1144.5396(1)第一步,选择“插入”菜单的“图表”子菜单,进入图表向导第二步,选择“图表类型”为“XY 散点图” ,然后单击下一步第三步,显示的对话框为“图表向导4 步骤之 2”,填写图表源数据之数据区域对话框,在“数据区域”中输入 A1:B31,选择图表系列产生在 “列”第四步,单击“下一步” ,出现“图表向导4 步骤之 3”页面,在图表标题中输入“重庆市1985-2014年粮食产量时间序列图”第五步,单击下一步,选择图表输出的位置,然后单击完成按钮,结果如下图重
23、 庆 市 1985-2014年 粮 食 产 量 时 间 序 列 图02004006008001000120014001980 1985 1990 1995 2000 2005 2010 2015 2020粮 食 产 量 ( 万 吨 )分析:由时间序列图可以知道,重庆市的粮食产量具有较强的长期趋势,呈逐年上升趋势。(2)先绘制表格数据的散点图,发现大致拟合线性曲线。重 庆 市 1985-2014年 粮 食 产 量 直 线 趋 势 拟 合 图y = 4.0659x +1032.29102004006008001000120014001980 1985 1990 1995 2000 2005 201
24、0 2015 2020粮 食 产 量 ( 万 吨 )线 性 (粮 食 产 量 ( 万 吨 ) )方法一:设粮食产量为 Y,年份序数为 X设函数为 Y=aX+b使用公式 slope和 intercept分别算出 a和 b(a=4.065943582,b=1032.290788)将 X=31代入公式,得到 2015年的预测结果。方法二:选定任意一个散点,单击右键,在菜单中选择“添加趋势线” ,选择“线性”在“选项”选项卡中选择“显示公式”得出线性方程:Y=4.0659X+1032.29112则 2015年预测产量=4.0659*31+1032.291=1158.33 万吨6.(1)该时间数列受长期
25、趋势的影响啤 酒 生 产 企 业 2007-2012年 各 季 度 的 啤 酒 销 售 量 数 据 散 点 图01020304050600 5 10 15 20 25 30销 售 量线 性 (销 售 量 )(2)第一步,由散点图可知数据受长期趋势的影响,所以采用移动平均趋势剔除法第二步,单击“工具”菜单中的“数据分析”选项,在其对话框“分析工具”列表中选择“移动平均” ,单击“确定” ,进入移动平均对话框。第三步,设定数据,间隔为 4,粘贴在第二格上第四步,由于是偶数移动平均,所以需要进行二次平均(T)第五步,计算 Y/T,得到如下表格时间 序号 销售量 第一次移动平 均 第二次移动平 均 Y
26、/T2007年第一季度 1 25第二季度 2 32 30第三季度 3 37 31.25 30.625 1.208163265第四季度 4 26 32.75 32 0.81252008年第一季度 5 30 34 33.375 0.898876404第二季度 6 38 35 34.5 1.101449275第三季度 7 42 34.75 34.875 1.204301075第四季度 8 30 35 34.875 0.8602150542009年第一季度 9 29 37 36 0.805555556第二季度 10 39 38.25 37.625 1.03654485第三季度 11 50 38.5 3
27、8.375 1.302931596第四季度 12 35 38.5 38.5 0.9090909092010年第一季度 13 30 38.75 38.625 0.776699029第二季度 14 39 39.25 39 1第三季度 15 51 39 39.125 1.303514377第四季度 16 37 39.75 39.375 0.939682542011年第一季度 17 29 40.75 40.25 0.720496894第二季度 18 42 41 40.875 1.02752293612第三季度 19 55 41.5 41.25 1.333333333第四季度 20 38 41.75 4
28、1.625 0.9129129132012年第一季度 21 31 41.5 41.625 0.744744745第二季度 22 43 42.25 41.875 1.026865672第三季度 23 54第四季度 24 41第一步,将所求出的数据分别列在空白单元格内,分别计算月平均数,总平均数,和季节指数。第二步,季节指数=平均数/总平均数第三步,验算可知季节指数之和=4,结果正确。得到如下图的表格季度 一 二 三 四2007 1.208163265 0.81252008 0.898876404 1.101449275 1.204301075 0.8602150542009 0.805555556 1.03654485 1.302931596 0.9090909092010 0.776699029 1 1.303514377 0.939682542011 0.720496894 1.027522936 1.333333333 0.9129129132012 0.744744745 1.026865672平均数 0.789274526 1.038476547 1.270448729 0.886880283总平均数 0.996270021季节指数 0.792229525 1.042364544 1.275205218 0.890200713季节指数合计 4