1、统计软件及应用课程论文班级 1083011 学号 108301132 姓名 杨奇军 评分 南昌航空大学经济管理学院关于某地区 361 个人旅游情况统计分析报告一、 提出问题为了了解某地区的旅游情况,发展该地的旅游经济,促进该地人民的生活水平的提高,现通过 SPSS 软件对某地区 361 个人旅游情况进行分析,从而更好地掌握该地旅游情况,为经济发展提出决策二、 数据收集本次分析的数据为某地区 361 个人旅游情况状况统计表,其中共包含七变量,分别是:年龄,为三类变量;性别,为二类变量(0 代表女,1 代表男) ;收入,为一类变量;旅游花费,为一类变量;通道,为二类变量(0 代表没走通道,1 代表
2、走通道) ;旅游的积极性,为三类变量(0 代表积极性差,1 代表积极性一般,2 代表积极性比较好,3 代表积极性好 4 代表积极性非常好) ;额外收入,一类变量。通过运用 spss 统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析、 。 。 。以了解该地区上述方面的综合状况,并分析个变量的分布特点及相互间的关系此数据来源于 http:/www.amstat.org/publications/jse/jse_data_archive.htm三、 数据统计处理 1、频数分析 基本的统计分析往往从频数分析开始。通过频数分地区 359 个人旅游基本状况的统计数据表,在性别、旅游的积极性不同
3、的状况下的频数分析,从而了解该地区的男女职工数量、不同积极性况的基本分布。Statistics性别Valid 359NMissing 0首先,对该地区的男女性别分布进行频数分析,结果如下性别Frequency Percent Valid PercentCumulative Percent女 198 55.2 55.2 55.2男 161 44.8 44.8 100.0ValidTotal 359 100.0 100.0表说明,在该地区被调查的 359 个人中,有 198 名女性,161 名男性,男女比例分别为 44.8%和 55.2%,该公司职工男女数量差距不大,女性略多于男性其次对原有数据中
4、的旅游的积极性进行频数分析,结果如下表 :旅游积极性Frequency Percent Valid PercentCumulative Percent差 171 47.6 47.6 47.6一般 79 22.0 22.0 69.6比较好 79 22.0 22.0 91.6好 24 6.7 6.7 98.3非常好 6 1.7 1.7 100.0ValidTotal 359 100.0 100.0Statistics通道Valid 359NMissing 0通道Frequency Percent Valid PercentCumulative Percent没走通道 293 81.6 81.6 8
5、1.6通道 66 18.4 18.4 100.0ValidTotal 359 100.0 100.0表说明,在该地区被调查的359个人中,有没走通道的占81.6% ,占绝大多数。上表及其直方图说明,被调查的 359 个人中,对与旅游积极性差的组频数最高的,为 171 人数的 47.6%,其次为积极性一般和比较好的,占比例都为 22.0%,积性为好的和非常好的比例比较低,分别为 24 人和6 人,占总体的比例为 6.7%和 1.7%2、相关分析相关分析是分析客观事物之间关系的数量分析法,明确客观事之间有怎样的关系对理解和运用相关分析是极其重要的。函数关系是指两事物之间的一种一一对应的关系,即当一
6、个变量 X 取一定值时,另一个变量函数 Y 可以根据确定的函数取一定的值。另一种普遍存在的关系是统计关系。统计关系是指两事物之间的一种非一一对应的关系,即当一个变量 X 取一定值时,另一个变量 Y 无法根据确定的函数取一定的值。统计关系可分为线性关系和非线性关系。事物之间的函数关系比较容易分析和测度,而事物之间的统计关系却不像函数关系那样直接,但确实普遍存在,并且有的关系强有的关系弱,程度各有差异。如何测度事物之间的统计关系的强弱是人们关注的问题。相关分析正是一种简单易行的测度事物之间统计关系的有效工具。Correlations收入 旅游花费 额外收入Pearson Correlation 1
7、 .140* .853*Sig. (2-tailed) .008 .000收入N 359 359 359Pearson Correlation .140* 1 .183*Sig. (2-tailed) .008 .000旅游花费N 359 359 359Pearson Correlation .853* .183* 1额外收入Sig. (2-tailed) .000 .000N 359 359 359*. Correlation is significant at the 0.01 level (2-tailed).上表是对本次分析数据中,旅游花费、收入、 、额外收入的相关分析,表中相关系数旁
8、边有两个星号(*)的,表示显著性水平为 0.01 时,仍拒绝原假设。一个星号(*)表示显著性水平为 0.05 是仍拒绝原假设。先以现旅游花费这一变量与其他变量的相关性为例分析,由上表可知,旅游花费与额外收入的相关性最大,3、回归分析有相关性分析可得 收入,旅游花费呈线性相关,因此作回归分析Variables Entered/RemovedbModelVariables EnteredVariables Removed Method1 收入 a . Entera. All requested variables entered.b. Dependent Variable: 旅游花费Model S
9、ummarybModel R R SquareAdjusted R SquareStd. Error of the Estimate1 .140a .020 .017 129.604a. Predictors: (Constant), 收入b. Dependent Variable: 旅游花费ANOVAbModel Sum of Squares df Mean Square F Sig.Regression 120443.809 1 120443.809 7.170 .008aResidual 5996596.239 357 16797.1881Total 6117040.048 358a.
10、Predictors: (Constant), 收入b. Dependent Variable: 旅游花费CoefficientsaUnstandardized CoefficientsStandardized CoefficientsModel B Std. Error Beta t Sig.(Constant) 91.563 11.528 7.943 .0001收入 .024 .009 .140 2.678 .008a. Dependent Variable: 旅游花费Residuals StatisticsaMinimum Maximum Mean Std. Deviation NPre
11、dicted Value 91.74 241.90 116.41 18.342 359Std. Predicted Value -1.345 6.842 .000 1.000 359Standard Error of Predicted Value6.840 47.362 9.048 3.426 359Adjusted Predicted Value 92.09 271.79 116.53 19.018 359Residual -193.904 891.785 .000 129.423 359Std. Residual -1.496 6.881 .000 .999 359Stud. Resid
12、ual -1.607 6.891 .000 1.002 359Deleted Residual -223.789 894.316 -.117 130.229 359Stud. Deleted Residual -1.611 7.390 .004 1.025 359Mahal. Distance .000 46.811 .997 2.955 359Cooks Distance .000 .199 .003 .015 359Centered Leverage Value .000 .131 .003 .008 359a. Dependent Variable: 旅游花费Charts 由上图可知回归方程:y=91.563+ 0.024 (x1) , (P(Sig=0.000)005旅游花费不成显著性差异,由图中可知旅行的旅游花费较高2、对策建议从上数据的结果可知,被调查者旅游积极性较差的好多,原因在于工资收入不是很高,用在旅游方面的花费就比较少。旅游花费没有非常大的区别,主要是旅行花费较高。因此我们要扩大该地区的人均收入,增强该地区人民的旅游积极性,促进旅游消费,实现经济又好又快发展,旅游经济是绿色经济我们要实现良性循环,对该地的长久快速发展是非常有利的