1、SPSS 最 适 用 的 统 计 学 方 法 ( X2检 验 和 T 检 验 )1 SPSS 的启动(1) 在 windows开始 程序spss20,进入 SPSS for Windows 对话框,2创建一个数据文件三个步骤:(1)选择菜单 【文件】【 新建】【数据】新建一个数据文件。(2)单击左下角 【变量视窗 】标签进入变量视图界面,定义每个变量类型。(3)单击【 数据视窗】标签进入数据视窗界面,录入数据库单元格内。3读取外部数据当前版本的 SPSS 可以很容易地读取 Excel 数据,步骤如下:(1)按【文件 】【打开 】【数据】的顺序使用菜单命令调出打开数据对话框,在文件类型下拉列表中
2、选择数据文件,如图 2.2 所示。图 2.2 Open File 对话框(2)选择要打开的 Excel 文件,单击“打开”按钮,调出打开 Excel 数据源对话框,如图 2.3 所示。对话框中各选项的意义如下:工作表 下拉列表:选择被读取数据所在的 Excel 工作表。范围 输入框:用于限制被读取数据在 Excel 工作表中的位置。图 2.3 Open Excel Data Source 对话框4数据编辑在 SPSS 中,对数据进行基本编辑操作的功能集中在 Edit 和 Data 菜单中。5SPSS 数据的保存SPSS 数据录入并编辑整理完成以后应及时保存,以防数据丢失。保存数据文件可以通过【
3、文件】【保存】或者【文件】【另存为】菜单方式来执行。在数据保存对话框(如图 2.5 所示)中根据不同要求进行 SPSS 数据保存。图 2.5 SPSS 数据的保存5. 数据分析在 SPSS 中,数据整理的功能主要集中在【数据】和【分析】两个主菜单下6.语 言 切 换 : 编 辑 ( E) 选 项 ( N) -用 户 界 面 -语 言 -简 体 中 文第 六 章 : 描 述 性 统 计 分 析 (X2 检 验 )完 成 计 数 资 料 和 等 级 资 料 的 统 计 描 述 和 一 般 的 统 计 检 验 , 我 们 常 用 的 X2 检验 也 在 其 中 完 成 。6.1.1 界 面 说 明界
4、 面 如 下 所 示 : 分析描述统计 频率用 于 定 义 需 要 计 算 的 其 他 描 述 统 计 量 。现 将 各 部 分 解 释 如 下 :Percentile Values复 选 框 组 定 义 需 要 输 出 的 百 分 位 数 , 可 计 算1.四 分 位 数 (Quartiles)、2.每 隔 指 定 百 分 位 输 出 当 前 百 分 位 数 (Cut points for equal groups)3.直 接 指 定 某 个 百 分 位 数 (Percentiles),如直接P2.5和P97.5o Central tendency复选框组 用于定义描述集中趋势的一组指标:均
5、数(Mean)、中位数(Median)、众数(Mode)、总和(Sum)。o Dispersion复选框组 用于定义描述离散趋势的一组指标:标准差(Std.deviation)、方差(Variance)、全距 (Range)、最小值(Minimum)、最大值(Maximum)、标准误(S.E.mean)。 o Distribution复选框组 用于定义描述分布特征的两个指标:偏度系数(Skewness)和峰度系数(Kurtosis)。 o Values are group midpoints复选框 当你输出的数据是分组频数数据,并且具体数值是组中值时,选中该复选框以通知SPSS,免得它犯错误。
6、 【Charts钮】 弹出Charts对话框,用于设定所做的统计图。 o Chart type单选钮组 定义统计图类型,有四种选择:无、条图(Bar chart)、圆图(Pie chart)、直方图Histogram),其中直方图还可以选择是否加上正态曲线(With normal curve)。 例:许根友要求统计的。丙氨酸氨基转移酶(ALT)调查,男性244人有50人异常,女性255人有6人结果异常,结果是否有统计学意义。X2卡方值是41.777,PDescriptive Statistics=Frequencies (分析描述统计频率-)2. Variables(变量)框:选入X 3. 单
7、击Statistics(统计量)钮: 4. 选中Mean(均数)、Std.deviation(标准差)、Median(中位数)复选框 5. 单击Percentiles(百 分 位 数 ):输入2.5:单击Add(添加):输入97.5:单击Add: 6. 单击Continue钮 7. 单击Charts(图表)钮: 8. 选中Bar charts (条形图)9. 单击Continue钮 10.单击OK 得出结果后手工计算出CV。6.1.3 结果解释 上题除直方图外的的输出结果如下: Frequencies 统计量X有效 101N 缺失 0均值 4.6995中值 4.6100标准差 .8616225
8、 3.0455百分位数97.5 6.4565最上方为表格名称,左上方为分析变量名,可见样本量N为101例,缺失值0例,均数Mean=4.69,中位数Median=4.61,标准差STD=0.8616,P2.5=3.04,P97.5=6.45。 系统对变量x作频数分布表(此处只列出了开头部分),Vaild右侧为原始值,Frequency为频数,Percent为各组频数占总例数的百分比(包括缺失记录在内),Valid percent为各组频数占总例数的有效百分比,Cum Percent为各组频数占总例数的累积百分比。 6.2 Descriptives过程最上方为表格名称,左上方为分析变量名,可见样
9、本量N为101例,缺失值0例,均数Mean=4.69,中位数Median=4.61,标准差STD=0.8616,P2.5=3.04,P97.5=6.45。X频率 百分比 有效百分比 累积百分比2.70 1 1.0 1.0 1.03.04 1 1.0 1.0 2.03.05 1 1.0 1.0 3.03.18 1 1.0 1.0 4.03.24 1 1.0 1.0 5.03.35 2 2.0 2.0 6.93.37 1 1.0 1.0 7.93.40 1 1.0 1.0 8.93.50 1 1.0 1.0 9.93.56 1 1.0 1.0 10.93.61 1 1.0 1.0 11.93.64
10、 1 1.0 1.0 12.93.89 1 1.0 1.0 13.93.91 1 1.0 1.0 14.93.93 1 1.0 1.0 15.83.95 1 1.0 1.0 16.83.97 1 1.0 1.0 17.84.03 2 2.0 2.0 19.84.08 1 1.0 1.0 20.8有效4.09 2 2.0 2.0 22.84.12 2 2.0 2.0 24.84.17 2 2.0 2.0 26.74.23 1 1.0 1.0 27.74.24 1 1.0 1.0 28.74.25 1 1.0 1.0 29.74.31 2 2.0 2.0 31.74.32 1 1.0 1.0 32
11、.74.34 1 1.0 1.0 33.74.37 1 1.0 1.0 34.74.38 2 2.0 2.0 36.64.40 1 1.0 1.0 37.64.43 1 1.0 1.0 38.64.44 1 1.0 1.0 39.64.47 2 2.0 2.0 41.64.50 1 1.0 1.0 42.64.52 1 1.0 1.0 43.6系统对变量x作频数分布表(此处只列出了开头部分),Vaild右侧为原始值,Frequency为频数,Percent为各组频数占总例数的百分比(包括缺失记录在内),Valid percent为各组频数占总例数的有效百分比,Cum Percent为各组频数占
12、总例数的累积百分比。6.2 Descriptives过程(描述性统计分析)以上面的题为例,分析统计描述描述选项均值、标准差、方差、最小值、最大值、均值的标准误、变量例表-继续-确定。下面是一个典型的Descriptives过程结果统计表:描述统计量N 极小值 极大值 均值 标准差统计量 统计量 统计量 统计量 标准误 统计量X 101 2.70 7.22 4.6995 .08573 .86162有效的 N (列表状态) 1016.4 Crosstabs过程(交叉表)Crosstabs过程用于对计数资料和有序分类资料进行统计描述和简单的统计推断。在分析时可以产生二维至n维列联表,并计算相应的百分
13、数指标。统计推断则包括了我们常用的X 2检验、Kappa值,分层X 2(X 2M-H)。如果安装了相应模块,还可计算n维列联表的确切概率(Fishers Exact Test)值。6.4.2 分析实例 例6.2 某医生用国产呋喃硝胺治疗十二指肠溃疡,以甲氰咪胍作对照组,问两种方法治疗效果有无差别(医统第二版P37 例3.10 )?处 理 愈 合 未愈合 合计呋喃硝胺 54 8 62甲氰咪胍 44 20 64合 计 98 28 126解:由于此处给出的直接是频数表,因此在建立数据集时可以直接输入三个变量行变量、列变量和指示每个格子中频数的变量,然后用Weight Cases对话框指定频数变量,最
14、后调用Crosstabs过程进行X 2检验。假设三个变量分别名为R、C和W,则数据集结构和命令如下:R C W 1.00 1.00 54.001.00 2.00 44.002.00 1.00 8.002.00 2.00 20.00也可以这样治疗情况 药物 X 1.00 1.00 54.001.00 2.00 44.002.00 1.00 8.002.00 2.00 20.00在变量视图治疗情况的值中标签(1=愈合,2=未愈合)在变量视图药物的值中标签(1=呋喃硝胺,2=甲氰咪胍)在变量视图治疗情况、药物、X的类型全为数值一、1. Data=Weight Cases (数据=加权个案)2. We
15、ight Cases by单选框:选中加权个案单选框3. Freqency Variable(频率变量):选入X4. 单击OK钮(单击确定按钮)二、5. Analyze=Descriptive Statistics=Crosstabs (分析=描述统计=交叉表)6. Rows(行)框:选入药物、7. Columns(列)框:选入治疗情况8. Statistics(统计量)钮:Chi-square(卡方)复选框:选中:单击Continue(继续)钮9. 单击OK(确定)钮6.4.3 结果解释 上题的结果如下: 案例处理摘要案例有效的 缺失 合计N 百分比 N 百分比 N 百分比药物 * 治疗情况
16、 126 100.0% 0 0.0% 126 100.0%首先是处理记录缺失值情况报告,可见 126 例均为有效值。药物* 治疗情况 交叉制表计数治疗情况愈合 未愈合合计呋喃硝胺 54 8 62药物甲氰咪胍 44 20 64合计 98 28 126上面为列出的四格交叉表,实际使用时可以在其中加入变量值标签,使看起来更清楚。卡方检验值 df 渐进 Sig. (双侧)精确 Sig.(双侧) 精确 Sig.(单侧)Pearson 卡方 6.133a 1 .013连续校正 b 5.118 1 .024似然比 6.304 1 .012Fisher 的精确检验 .018 .011线性和线性组合 6.084
17、 1 .014有效案例中的 N 126上表给出了一堆检验结果,从左到右为:检验统计量值(Value) 、自由度(df) 、双侧近似概率(Asymp.Sig.2-sided)、双侧精确概率(Exact Sig.2-sided)、单侧精确概率(Exact Sig.1-sided);从上到下为:Pearson 卡方(Pearson Chi-Square 即常用的卡方检验)、连续性校正的卡方值(Continuity Correction)、对数似然比方法计算的卡方(Likelihood Ratio)、Fishers 确切概率法(Fishers Exact Test)、线性相关的卡方值(Linear b
18、y Linear Association)、有效记录数(N of Valid Cases)。另外,Continuity Correction 和Pearson 卡方值处分别标注有 a 和 b,表格下方为相应的注解:a.只为 2*2 表计算。b.0%个格子的期望频数小于 5,最小的期望频数为 13.78。因此,这里无须校正,直接采用第一行的检验结果,即 X2=6.133,P=0.013。如何选用上面众多的统计结果令许多初学者头痛,实际上我们只需要在未校正卡方、校正卡方和确切概率法三种方法之间选择即可,其余的对我们而言用处不大,可以视而不见。例:许根友要求统计的。丙氨酸氨基转移酶(ALT)调查,男
19、性244人有50 人异常,女性255人有 6人结果异常,结果是否有统计学意义。假设三个变量检查情况、性别、数量分别名为R、C和W,检查情况中 1=阳性,2= 阴性,性别中 1=男,2= 女则数据集结构和命令如下:R C W 1.00 1.00 50.001.00 2.00 6.002.00 1.00 194.002.00 2.00 249.00一、1. Data=Weight Cases (数据=加权个案) 2. Weight Cases by单选框:选中加权个案单选框3. Freqency Variable(频率变量):选入W4. 单击OK钮(单击确定按钮)5. Analyze=Descri
20、ptive Statistics=Crosstabs (分析=描述统计=交叉表)6. Rows(行)框:选入男女、7. Columns(列)框:阳性、阴性8. Statistics(统计量)钮:Chi-square(卡方)复选框:选中,单击Continue(继续)钮,单元格-百分比-行9. 单击OK(确定) 钮看第一行: X2卡方值是41.777,PCorrelate=Bivariate。成对样本检验成对差分均数的95%可信区间 差值均值 标准差 均值的标准误 下限 上限t df自由度Sig.(双侧)P 值对 1 G1 - G2 812.500 546.2534 193.12977 355.820671269.17933 4.207 7 .004配对t检验表,给出最终的检验结果,由上表可见t=4.207,P=0.004,故可认为两种饲料所得肝中维生素A含量有差别,即维生素E缺乏对大白鼠肝中维生素A含量有影响。