spss期末复习总结.doc-道客多多

资源描述

1、1-1、SPSS 运行方式：菜单操作方式、程序运行方式、Include 运行方式、Production Facility方式。1-2、Spss 界面窗口：数据编辑窗口、结果管理窗口、结果编辑窗口、语法编辑窗口、脚本窗口。1-3、在数据预处理中应用最广泛的是计算变量。1-4、Spss 基本模块不能直接实现的功能：统计分析、数据计划、数据收集。1-6、spss 不能直接打开*.html 文件。2-1、spss 数据文件格式：每一行的数据成为一个记录；每一列为一个变量。2-2、Spss 数据编辑器界面为数据视图界面和变量视图界面（定义数据集的数据字典）。2-3、变量名命名准则：必须以英文字母开口，

2、其他部分可以含有字母、数字、下划线；变量名尽量避免和 spss 已有的关键字重复（sum、compute、anova）；变量名最长为 64 个英文字符或者 32 个中文字符；spss 变量名不区分大小写。2-4、变量的度量类型不是固定不变的，可以分局分析过程来改变变量的度量类型。2-5、spss 中字符型数据值区分大小写；字符型数据可以设置值标签。2-6、对于数据的处理缺省值默认为”.”，字符串默认为空，若空字符串有意义，需在变量是同对缺省值进行定义。2-7、spss 只读入数据（excel）。2-8、添加变量合并文件：一对一合并，一对多合并；合并相同个案数，不同属性的数据文件，为添加变量

3、；合并数据之前，需按关键变量进行排序，合并的诗句恩见必须是.sav 或已经在 spss 中打开的文件，并确保两个文件中需要合并的变量名称不同。3-1、可视化分段方法：直接输入分割点；根据条件自动生成分割点。3-2、填补缺失数据方法：序列均值、临近点均值、临近点的中位数、线性插值法、点处线性趋势。3-3、在做统计分析之前一般要做数据效验，如果是录入错误则重新录入；若数据确实错误，则可将这些数据设置成缺失值。3-4、 “标记异常个案”过程基于个案偏离聚类组中心的大小来判断异常个案，一般用于探索性数据分析步骤中。3-5、可视化变量分段是对连续数据进行离散化。4-1、描述数据特征的统计量，一类表示数据

4、的中心位置（均值、中位数、众数），一类表示数据的离散程度（方差、标准差、极差）。进行数据分析第一步往往是进行描述性统计分析。4-2、频率分析：对于给定的类，落入这个类的个案数成为频率，落入该类中的个案数和个案总数的比例成为相对频率直方图、条形图、集中趋势和离散趋势的统计量来描述数据的分布特征。4-3、饼图和条形图使用于分类变量类别个别数较少的情况，如果个别数较多，选择直方图。4-4、中心趋势的描述：均值、中位数、众数、5%截尾均值，指一组数据向某个中心值靠拢的倾向。对于连续变量（尺度变量）和定序变量，描述中心趋势的有均值、中位数、众数、5%截尾均值（升序排序，剔除最小和最大的 5%后的算术

5、均值）；对于定性数据（名义数据），指标只有众数。（尺度变量连续变量；名义变量定性数据；名义变量和定序变量分类变量）4-5、离散趋势的描述：极差、方差、标准差、分位数、变异指标。4-6、总结五数：最小值、下四分位数、中位数、上四分位数、最大值。（箱图）4-7、偏度：（-3,3），0，左偏，在左拖尾。=0 对称分布。峰度：3 ，高峰度，=0 ，正太峰。4-8、分析/ 描述统计 /频率（条形图、饼图、直方图）/描述/探索（箱图、茎叶图、直方图、Q-Q 图），输出统计量（均值、中值、众数、标准差、方差、偏度、峰度、全距、极值、百分位数）4-9、定性数据图形的描述：条形图、帕累托图（从高到低排

6、序条形图）、饼图。（首先加权个案）4-10、定量数据图形的描述：直方图（用于连续型数据）、茎叶图、箱图。4-11、在探索图里面勾选带检验的正态图可以输出选定变量的 QQ 图、变量正态性的 K-S 检验和 S-W 检验。4-12、IQR（四分位距） =Q3-Q1，最下面的短线 Q1-1.5IQR，最上面短线 Q3+1.5IQR，离群值（圆圈表示）落入Q3+1.5IQR ，Q3+3IQR）或者（Q1-3IQR，Q1-1.5IQR,极端值（表示）大于等于 Q3+3IQR 或 Q1-3IQR。4-13、如果只有一个因变量，茎叶图或者箱图按因子各个水平输出，选择不分组的输出结果和选择“按因子水平分

7、组”的输出结果只在标题的组织形式上略有不同，如果有两个因变量，则两种选项的结果差异较大。5-1、因为假设检验有何能犯两类错误：拒真、受伪。5-2、假设检验的步骤：确定恰当的原假设和被择假设；选择检验统计量；计算检验统计量观测值发生个概率（P ）；给定显著性水平，并作出决策。5-3、分析/ 比较均值 /均值，输出表格“案例处理摘要” （看缺失值）、 “均值报告表” （看均值列，趋势与增加幅度，如随着工作年限增加，小时工资也增加，增加幅度不均匀，列举每阶段增加幅度）、 “方差分析表（ANOVA 表） ”（线性显著性0.05，非线性关系成分不显著）、 “相关性度量表” （R 方值不大，线

8、性关系不十分强）5-4、双因素分析：在均值对话框下一张，均值过程只对第一层的自变量进行方差分析和线性相关检验（只有描述性统计表，即均值分析报告不一样，均值列分析：同等经验下，病房护士小时工资比办公室高，随着工作经验增加，差距变小；标准差列分析：同等经验的办公室护士，小时工资差距大于同等经验的医院护士）。5-5、单样本 T 检验即检验某个变量的总体均值和某指定值之间是否存在显著性差异。T 检验的稳健性好。数据准备：数据拆分文件分割文件比较组（完成分析之后要关闭文件分割）、单样本 T 检验：分析/比较均值/ 单样本 T 检验（输入检验值） “单个样本统计量”均值，偏离检验值、 “单个样本检验”

9、t 为 T 统计量，df 为自由度，sig （双侧）为 P 值，均值差值为各数据减去检验值，上限下限位该均值差 95%的置信区间的上限和下限。sig 值0.05，接受正态性假设）判定是够满足 T 检验前提条件，满足则进行 T 检验；分析/比较均值/独立样本 T 检验（定义分组变量） “组统计量” （显示均值、标准差及均值的标准误，均值的标准误即为标准差除以样本 N 的平方根）、 “独立样本检验” （方差方程的 Leven 检验，即方差齐性检验，和均值方程的 t 检验，p0.05 接受方差齐性假设，选择“假设方差相等” ，sig（双峰）0.05，线性相关不显著；剔除离群值：数据/选择个案/如果

10、、分割文件：数据/ 拆分文件、分析/相关/双变量“相关性” （相关系数、显著性）（散点图相关系数检验回归）8-1、确定变量之间线性相关后，通过回归分析找出线性关系。线性回归是指回归系数为线性，不是非相关变量和预测变量之间的的关系。8-2、回归分析的步骤：写出研究的问题和分析的目的、选择潜在相关变量、收集数据、选择合适拟合优度、模型求解、模型验证和评价、应用模型解决研究问题。8-3、简单线性回归：Y=0+1X+ （X 为预测变量，可控，Y 为因变量，随机，为随机误差，N(0, )，且假设与 X 无关）。8-4、决定系数 R=SSR/SST=1-SSE/SST，残差平方和 SSE，回归平方和

11、 SSR，总平方和SST=SSR+SSE，00.05，0.05 说明方差不齐，分析：在比较各个组别样本量相差不大，且各组分别的分布形态类似的情况下，方差分析对方差不等具有稳健性，案例中内个组个案数相等，峰度和偏度相等，分布形态类似，可进行方差分析，建议方差分析后进行相应非参检验验证方差分析结果）“ANOVA 表” （均方=相应平方和/自由度，F=组间均方/ 组内均方，一共三个组，组间自由度 2,60 个个案，3 个组，组内自由度 57。分析：显著性0.05，没有证据说明三种方式的效果相同）9-6、均值的两两比较：“多重比较” （观测：显著性。分析：多重比较结果一致，即培训两天和三天无差异，培训一天和另外两种都有差异）“同类子集” （同一类放在一列，当其中一个可以在任意一列时，看 sig 值大小，sig 值大的在一列，分析：TukeyB 两两比较把 5%的显著性水平下没有区别的总体放在同一列，作为同类子集，这里 2 天和 3 天没有差别，放在一列，1 天单独一列）“均值图” （直观看出总体均值的趋势）

展开阅读全文