1、SPSS 期 末 报 告关于员工受教育程度对其工资水平的影响统计分析报告课程名称: SPSS 统计分析方法 姓 名: 汤重阳 学 号: 1402030108 所在专业: 人力资源管理 所在班级: 三班 目 录一、数据样本描述 .1二、要解决的问题描述 .11 数据管理与软件入门部分 .11.1 分类汇总 .11.2 个案排秩 .11.3 连续变量变分组变量 .12 统计描述与统计图表部分 .12.1 频数分析 .12.2 描述统计分析 .13 假设检验方法部分 .23.1 分布类型检验 .23.1.1 正态分布 23.1.2 二项分布 23.1.3 游程检验 23.2 单因素方差分析 .23.
2、3 卡方检验 .23.4 相关与线性回归的分析方法 .23.4.1 相关分析(双变量相关分析&偏相关分析) .23.4.2 线性回归模型 24 高级阶段方法部分 .2三、 具体步骤描述 31 数据管理与软件入门部分 .31.1 分类汇总 .31.2 个案排秩 .41.3 连续变量变分组变量 .52 统计描述与统计图表部分 .52.1 频数分析 .52.2 描述统计分析 .73 假设检验方法部分 .83.1 分布类型检验 .83.1.1 正态分布 83.1.2 二项分布 .103.1.3 游程检验 .103.2 单因素方差分析 123.3 卡方检验 133.4 相关与线性回归的分析方法 143.
3、4.1 相关分析 .143.4.2 线性回归模型 .164 高级阶段方法部分 184.1 信度 184.2 效度 191一、数据样本描述分析数据来自于“微盘SPSS 数据包 data02-01”。(http:/ 474 名职工状况统计表,其中共包含 11 个变量,分别是:id(职工编号) ,gender(性别),bdate( 出生日期),edcu(受教育水平程度) ,jobcat(职务等级) ,salbegin(起始工资) ,salary(现工资) ,jobtime(本单位工作经历),prevexp(以前工作经历) , minority(民族类型 ),age(年龄)。通过运用 SPSS 统计软
4、件,对变量进行统计分析,以了解该公司职工总体状况,并分析职工受教育程度、起始工资、现工资的分布特点及相互间的关系。二、要解决的问题描述1 数据管理与软件入门部分1.1 分类汇总以受教育水平程度为分组依据,对职工的起始工资和现工资进行数据汇总。1.2 个案排秩对受教育水平程度不同的职工起始工资和现工资进行个案排秩。1.3 连续变量变分组变量将被调查者的年龄分为 10 组,要求等间距。2 统计描述与统计图表部分2.1 频数分析2利用了某公司 474 名职工基本状况的统计数据表,在性别、受教育水平程度不同的状况下进行频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。2.2 描述统计分
5、析以职工受教育水平程度为依据,对职工起始工资进行描述统计分析,得到它们的均值、标准差、偏度峰度等数据,以进一步把握数据的集中趋势和离散趋势。3 假设检验方法部分3.1 分布类型检验3.1.1 正态分布分析职工的现工资是否服从正态分布。3.1.2 二项分布抽样数据中职工的性别分布是否平衡。3.1.3 游程检验该样本中的抽样数据是否随机。3.2 单因素方差分析把受教育水平和起始工资作为控制变量,现工资为观测变量,通过单因素方差分析方法研究受教育水平和起始工资对现工资的影响进行分析。3.3 卡方检验职工的起始工资水平和现工资水平与其受教育程度之间是否存在关联性。33.4 相关与线性回归的分析方法3.
6、4.1 相关分析(双变量相关分析 &偏相关分析)对受教育程度和现工资两个变量进行相关性分析。3.4.2 线性回归模型建立用受教育程度预测现工资水平的回归方程4 高级阶段方法部分对该样本数据进行信效度检测三、具体步骤描述1 数据管理与软件入门部分1.1 分类汇总以受教育水平为分组依据,对职工的起始工资和现工资进行数据汇总。4图 1.1 分类汇总数据由图 1.1 所示,受教育等级以年为单位划分可分为 8 年、12 年、14 年等图中所示 10 个等级。以等级为 8 年为例,现工资均值为 24399.06 美元,起始工资均值为 13064.15 美元,统计量为 53 人。经比较可知,教育年限为 12
7、 年和 15 年的职工在公司中占大多数,教育年限为 20 年和 21 年的职工在公司中的初始工资平均水平较高,但教育年限为 19 年的职工现工资平均水平较高。51.2 个案排秩对受教育水平程度不同的职工起始工资和现工资进行个案排秩。表 1.2-1 现工资水平个案排秩统计量統計資料Rank of salary by educN有效遺漏4740平均數中位數標準偏差範圍最小值最大值60.4346046.5000050.975992189.0001.000190.000表 1.2-2 初始工资水平个案排秩统计量統計資料Rank of salbegin by educN有效遺漏47406平均數中位數標準
8、偏差範圍最小值最大值60.4346047.5000050.865407189.0001.000190.0001.3 连续变量变分组变量将被调查者的年龄分为 5 组。表 1.3 被调查者年龄分布(已分组)agec次數 百分比 有效的百分比 累積百分比7有效733343435353636373總計16267716762474.21.356.315.014.113.1100.0.21.356.315.014.113.1100.0.21.557.872.886.9100.0根据表 1.3 所示,该公司 474 名职员年龄几乎全部在 33 岁以上、73 岁以下,年龄层分布集中在已有工作经验的人当中,其中
9、 3343 岁的员工为该公司的主体。2 统计描述与统计图表部分2.1 频数分析利用了某公司 474 名职工基本状况的统计数据表,在性别、受教育水平程度不同的状况下进行频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。表 2.1-1 职工性别频数统计表Gender次數 百分比 有效的百分比 累積百分比有效FemaleMale總計21625847445.654.4100.045.654.4100.045.6100.0由表 2.1-1 可知,在该公司的 474 名职工中,有 216 名女性,258 名男性,男女比例分别为 45.6%和 54.4%,该公司职工男女数量差距不大,男性略多
10、于女性。8下面对该公司员工受教育程度进行频数分析:表 2.1-2 职工受教育程度频数统计表Educational Level (years)次數 百分比 有效的百分比 累積百分比11.2 11.2 11.253190 40.1 40.1 51.36 1.3 1.3 52.5116 24.5 24.5 77.059 12.4 12.4 89.511 2.3 2.3 91.89 1.9 1.9 93.7812141516171819 27 5.7 5.7 99.420 2 .4 .4 99.821 1 .2 .2 100.0有效總計 474 100.0 100.09图 2.1-2 职工受教育程度频
11、数分布直方图表 2.1-2 及其直方图说明,被调查的 474 名职工中,受过 12 年教育的职工是该组频数最高的,为 190 人,占总人数的 40.1%,其次为 15 年,共有 116 人,占总人数的 24.5%。且接受过高于 20 年的教育的人数只有 1 人,比例很低。2.2 描述统计分析以职工受教育水平程度为依据,对职工起始工资进行描述统计分析,得到它们的均值、10标准差、偏度峰度等数据,以进一步把握数据的集中趋势和离散趋势。 (由于输出结果较长,为了便于解释,仅截取职工受教育水平年限为 8 年的分析结果)图 2.2-1 职工起始工资描述统计表(部分)11图 2.2-2 职工起始工资描述统
12、计直方图(部分)图 2.2 给出的就是以受教育年限为 8 年时职工起始工资的描述统计,由此得出结论如下:(1)集中趋势指标:由图 2.2-1 可知,职工起始工资均值为$13064.15,5%截尾均数为$13016.35,中位数为$13050.00,三者差异较大,说明数据分布的对称性较差。(2)离散趋势指标:起始工资方差为 5799170.900,其平方根即标准差为 2408.147,样本中极小值为$9750,极大值为美元 18750,两者之差为全距(范围)$9000,中间一半样本的全距为四分位间距$4875。(3)参数估计:职工起始工资的标准误差为$330.784,相应的总体均数 95%可信区
13、间为$12400.38-$13727.92。(4)分布特征指标:根据描述统计数据可知,该样本数据中偏度为 0.1480,曲线右偏;峰度为-1.219接受 H0,认为抽样数据中职工性别比例无差异。3.1.3 游程检验该样本中的抽样数据是否随机(检测数据均以均值为分割点) 。(1)性别:H0:抽样数据中性别序列为随机序列H1:抽样数据中性别序列不为随机序列=0.05表 3.1.3-1 性别序列游程检验連檢定gender測試值 a .46觀察值 = 檢定值 216總箱數 47415連個數 110Z -11.692漸近顯著性 (雙尾) .000a. 平均數图 3.1.3-1 性别序列游程检验详细模型输
14、出P=0.000P= 檢定值 175總箱數 473連個數 196Z -2.519漸近顯著性 (雙尾) .012a. 平均數图 3.1.3-2 年龄序列游程检验详细模型输出结果P=0.012P接收 H1,认为年龄序列不是随机序列。173.2 单因素方差分析把受教育水平和起始工资作为控制变量,现工资为观测变量,通过单因素方差分析方法研究受教育水平和起始工资对现工资的影响进行分析。(1)起始工资对现工资的影响分析H0:认为起始工资对现工资没有显著影响H1:认为起始工资对现工资有显著影响=0.05表 3.2-1 起始工资对现工资的影响分析结果變異數分析Current Salary平方和 df 平均值平
15、方 F 顯著性群組之間 121986603521.736 89 1370635994.626 33.040 .000在群組內 15929891914.603 384 41484093.528總計 137916495436.340 473P=0.000P接受 H1,认为起始工资对现工资有显著影响。(2)受教育水平对现工资的影响分析对受教育水平与现工资之间进行方差齐性检测,其结果如下:18表 3.2-2 方差齐性检验结果變異數同質性測試Current SalaryLevene 統計資料 df1 df2 顯著性16.169 8 464 .000P=0.0000.05,认为该样本方差不齐的要求,因此下
16、面进行的方差分析结论的稳定性较差。单因素方差检验:H0:认为受教育水平对现工资没有显著影响H1:认为受教育水平对现工资有显著影响=0.05表 3.2-3 受教育水平对现工资的影响分析结果變異數分析Current Salary平方和 df 平均值平方 F 顯著性群組之間 88653535061.984 9 9850392784.665 92.779 .000在群組內 49262960374.356 464 106170173.221總計 137916495436.340 473P=0.000P接受 H1,认为职工受教育水平对现工资有显著影响。193.3 卡方检验职工的起始工资水平和现工资水平与其
17、受教育程度之间是否存在关联性。(1)H0:起始工资水平与受教育程度之间不存在关联性H1:起始工资水平与受教育程度之间存在关联性=0.05表 3.3-1 起始工资与受教育程度的分析结果卡方測試數值 df 漸近顯著性 (2 端)皮爾森 (Pearson) 卡方 1969.189a 801 .000概似比 765.651 801 .811線性對線性關聯 189.643 1 .000有效觀察值個數 474a. 878 資料格 (97.6%) 預期計數小於 5。預期的計數下限為 .00。P=0.000P接受 H1,认为起始工资与受教育程度之间存在关联性。(2)H0:现工资与起始工资之间不存在关联性H1:
18、现工资与起始工资之间存在关联性=0.0520表 3.3-2 现工资与起始工资的分析结果卡方測試數值 df 漸近顯著性 (2 端)皮爾森 (Pearson) 卡方 26391.304a 19580 .000概似比 2672.323 19580 1.000線性對線性關聯 366.389 1 .000有效觀察值個數 474a. 19890 資料格 (100.0%) 預期計數小於 5。預期的計數下限為 .00。P=O.OOOP接受 H1,认为现工资与起始工资之间存在关联性。3.4 相关与线性回归的分析方法3.4.1 相关分析(1)双变量相关分析对受教育程度与现工资之间进行相关性分析。表 3.4.1-1
19、 受教育程度与现工资间相关性检测21相關Educational Level (years) Current Salary皮爾森 (Pearson) 相關 1 .661*顯著性 (雙尾) .000Educational Level (years)N 474 474皮爾森 (Pearson) 相關 .661* 1顯著性 (雙尾) .000Current SalaryN 474 474*. 相關性在 0.01 層上顯著(雙尾) 。由表 3.4.1-1 可知,受教育程度与现工资之间存在相关性,相关系数为 0.661,对相关系数的检验双侧 P=0.000,所以可以认为两变量间的正相关是有统计学意义的,受
20、教育程度影响职工的现工资水平,即受教育程度越高,现工资水平越高。(2)偏相关分析由于上述检测数据无法说明相关系数中有多少是反映“受教育程度-初始工资水平-现工资水平”这样一种简介的链条影响,也就是说,在控制了初始工资水平之后,受教育程度与现工资水平之间的相关性不确定,因此,下面采用偏相关分析对这三个因素进行分析。表 3.4.1-2 受教育程度与现工资水平偏相关分析相關控制變數 Current SalaryEducational Level (years)相關 1.000 .281顯著性(雙尾) . .000Beginning Salary Current Salarydf 0 47122相關
21、.281 1.000顯著性(雙尾) .000 .Educational Level (years)df 471 0如图 3.4.1-2 所示,在控制初始工资后计算出受教育水平与现工资的偏相关系数为0.281,对相关系数检验双侧 P=0.000,虽然相关系数有所减小,但仍然具有统计学意义。在控制初始工资后仍可以认为受教育程度影响职工现工资水平,且受教育程度越高,现工资水平越高。3.4.2 线性回归模型建立用受教育程度预测现工资的回归方程。23图 3.4.2 受教育程度与现工资水平散点图由图 3.4.2 可以看出,受教育程度与现工资水平之间存在线性相关关系,且可以用回归方程来解释两变量之间的关系。
22、表 3.4.2-1 回归方程模型汇总模型摘要模型 R R 平方 調整後 R 平方 標準偏斜度錯誤1 .661a .436 .435 $12,833.540a. 預測值:(常數) ,Educational Level (years)由表 3.4.2-1 可知,决定系数 R2=0.436,说明在对现工资水平的影响因素中,受教育程24度起到一定的作用,但是并非决定性作用。表 3.4.2-2 回归模型方差分析结果變異數分析 a模型 平方和 df 平均值平方 F 顯著性迴歸 60178217760.000 1 60178217760.000 365.381 .000b殘差 77738277676.339
23、 472 164699740.8401總計 137916495436.340 473a. 應變數: Current Salaryb. 預測值:(常數) ,Educational Level (years)由表 3.4.2-2 可知,对该回归方程模型的方差分析中,F 值为 365.381,P 值小于 0.05,所以该模型具有统计意义,也就是说,自变量受教育程度的回归系数具有统计意义。表 3.4.2-3 回归方程常数项及回归系数检验结果係數 a模型 非標準化係數 標準化係數 T 顯著性25B 標準錯誤 Beta(常數) -18331.178 2821.912 -6.496 .0001 Educat
24、ional Level (years) 3909.907 204.547 .661 19.115 .000a. 應變數: Current Salary由表 3.4.2-3 可知,回归方程中 a=-18331.178,b=3909.907,因此可以写出如下回归方程:现工资水平=-18331.178+3909.907*受教育程度(年)由该方程可得出如下信息:(1)当受教育年限是 0 年时,在该公司内的现工资水平为$-18331.2。(2)受教育年限每增加一个单位,在该公司内的现工资水平将增加$3909.9。4 高级阶段方法部分对该样本数据进行信效度检测。4.1 信度26表 4.1-1 样本数据信度
25、检测可靠性統計資料Cronbach 的 Alpha 項目個數.601 3表 4.1-2 除去某项后信度检测结果項目總計統計資料尺度平均數(如果項目已刪除)尺度變異數(如果項目已刪除)更正後項目總數相關Cronbach 的 Alpha(如果項目已刪除)Educational Level (years) 51435.65 590094313.948 .669 .802Current Salary 17029.58 61975707.433 .880 .001Beginning Salary 34433.06 291643301.912 .880 .000由表 4.1-1 可得出结论:该样本数据总体 =0.601,信度良好。由表 4.1-2 可得出结论:当信度检测中除去受教育程度后的 =0.802,大于总体信度0.601,说明该项目的信度对总体信度检测产生负向影响。