1、市场调研分析工具:SPSS 操作基础纪浩然学习导航通过学习本课程,你将能够: 掌握 SPSS 的基本操作; 熟知 SPSS 基本分析模块; 了解统计分析的基本概念。 市场调研分析工具:SPSS 操作基础一、SPSS 基本操作1.SPSS 的基本认识SPSS 是市场调查的有效工具之一,对这一工具应当具备以下基本认识:SPSS 的输出结果基本和 office 兼容SPSS 提供了一个类似于 Excel 的操作界面,同 时 SPSS 可以打开 Excel 文件。由于很多公司的各类信息是录入到 Excel 文件中的,这样就能够顺利地将相关信息导入 SPSS。SPSS 具备很好的画图功能SPSS 可以将
2、各类信息整理成各类实用而清晰的图表,这是很多公司都非常关心的一项功能。图 1 SPSS 的操作界面如图 1 所示,SPSS 的操作界面与 Excel 非常相似,这款软件是 20 世纪 50 年代斯坦福大学的三个研究生研发成功的,此后不断 发展成为世界上最著名和客户占有量最大的统计软件。2009 年, 这一软件被 IBM 公司收购,随后在商务上得到快速推进,因为 IBM 计划将 SPSS 打造成一款商务智能软件,而不是只局限在高校范围内。比如, 该软件有一个“直销”(Direct sells)模块,这 是在数据分析中经 常用到的模块,里面放入了一些非常著名的商务分析模型,如客 户价值判断模型(R
3、FM),这一模型可以根据客 户的购买频次、 购买金额、最后一次购买时间等信息,对客 户做出价值判断并 进行分组, 这些都是 SPSS 被 IBM 收购后发生的变化。目前,中国移动、各大银行、淘宝网等知名公司都在 应用这些数据分析模块。由于国内的软件版权保护制度比较落后, IBM 目前并不以软件销售作为主赢利渠道,而是主要通过商务咨询和相关服务获取利润。2.SPSS 的操作流程SPSS 的主要操作流程大致可以分为五部分:第一,数据读入是将相关数据读入 SPSS 中;第二,数据预处理数据读入后,要稍微做一下 预处理才能继续操作;第三,模型处理选择一个模型进行分析,然后 SPSS 就会输出相应的结果
4、;第四,结果解读对输出的结果要进行必要的解读;第六,结果二次处理最后对结果进行一些再处理。3.SPSS 的操作示例SPSS 的操作基础示例 1动作 1:用 SPSS 打开一个 Excel 文件。点 击“打开数据”,并在目 录中找到名为“数据购买”的示例文件。由于 SPSS 默认的是打开文件名为“sav ”的文件,所以要在文件名下拉框中选择文件名为“xls(x)” 的 Excel 文件。打开界面后,如果 Excel 文件的第一行有表头,就要勾 选;如果没有表头,就点 击“ 确定” ,这样就能将 Excel 文件读入 SPSS。数据读入后能够发现,这是一张市场调查的结果文件,这时会看到两个不同的标
5、签,一是数据视图;一是变量视图,也就是将变量的属性放到视图中去。然后打开“ 变量视图”,如图 2 所示。 图 2 变量视图 动作 2:在变量视图中改变“值” ,如性 别。变量视图包括表头、宽度小数等内容,尤其是其中的“值”应当予以特别关注,只有完成相关的赋值才能够进行分析。动作 3:采用“ 分析-比较均 值- 均值”,分析不同性别的受访者的产品消息来源、购买来源、购买原因和书价。在表头中选择 “性别”,将其放入“自 变量” ,然后按“shift”键统一选中消息来源、购买来源、 购买原因和书价等 进行基本操作,再点 击 “选项”就会发现不同性别的各类值,在此只关注均值,去掉个案数和 标准差。然后
6、点 击“确定” 就会输出相应的结果。SPSS 的输出结果有时会非常复杂,为了将其简单化,可以只选择其中的重要部分,对于那些用处不大且比较晦涩的不妨略过。由于 SPSS 每次处理都是模式化的,所以当操作熟练后就会得心应手。在上面的示例中,为了更直观地获取感性认识,采用了“ 反例”手法,也就是先有了选项和平均值,再点击数据窗口切 换到原数据, 为了让输出 结果中“ 1”代表男,“ 2”代表女,可以进入变量视图,在“ 性别”栏中双击“无” ,然后在弹出的窗口中添加用“1” 代表男,“2” 代表女,然后点击确定。这时要想在数据视图 中检查某个值是否被标记过,可以在“ 视图”上点击“值标签” ,这样设置
7、完的值就会显示出来。然后可以用同样的方法再进行一遍正常操作,由于之前的“ 比较均值”和“均值”等已经完成,所以不需要改 动,直接点 击确定即可,然后就会 发现结果的变化。SPSS 的操作基础示例 2动作 1:绘制散点图。在 Excel 操作中经常会用到许多图表,如柱状图、饼状图、散点图、射线图、曲 线图、气泡图、雷达 图 、双 轴图等,这些图在 SPSS 中都有,而且分析功能更加强大。接前文示例 1 所述,为了分析不同年 龄受访者购书价格的分布情况,就可以采用散点图的方式。绘制散点图可以很好地呈现出数据的分布特征,在 实际工作中非常有用,是图形分析的基本功。具体操作是使用“图形改造程序” 或旧
8、版对话框,然后点击“散点图” 并为其定义,在 X 轴中放入书价,在 Y 轴 中放入年龄 。为了使散点图承载的信息量更大,便于更好地根据不同性别进行数据分析,可以打开“ 设置标记”并点击 “确定”,这时 就可以看到图中的要素分 为几个层次:首先是书价,从 100 元一直到700 元;其次是年龄,在 X 轴上呈递增分布;然后可以将男女性别拆分开来,用不同的颜色代表两种性别,分别观察男性受 访者和女性受访者的购书数据分布状况。具体内容如图 3 所示。图 3 散点图 动作 2:在“图标编辑 器” 中更改 颜色。 为了使图表呈报得更加清晰,可以双击这张图进入“图标编辑器” ,双击女性的某个散点进行“预览
9、” ,这时就可以更改代表女性的散点图标的格式,比如大小、边框、颜色等。在 这 里将其大小改为“10” ,边框改为醒目的红色,然后点击“应用”并关闭图标编辑器,图中代表女性的散点 图标就会完成更改。回到图中可以发现,20 岁到 30 岁的女性购书花费比较高,结论是这个年龄段的白领女性购买力较强,而且学习充电 的动力很大,所以 购书花 费较多。通过上面的示例可以看出,要想绘制出各类实用美观的图表,一是要了解绘图中的 X 轴、Y 轴、设 置标记 以及面板依据中行、列的意义;二是要了解和掌握图标编辑器的基本功能。 二、SPSS 基本分析模块在市场调研分析中,最常用到的 SPSS 模块是“数据” 、“转
10、换” 和“分析”,其中 “数据”和“ 转换”主要是用来做 SPSS 的商 业数据的预处理,而“分析 ”主要用于各种各样的建模,里面包含了大部分常用的基本分析模块。具体内容如图 4 所示。图 4 SPSS 的三个常用主模块 在图 4 的模块下面,市场调查中常用的 SPSS 基本分析模块主要包括描述统计、交叉表(cross table,也叫列联表)、相关、回 归、分 类、降维、多重相应和最优尺度等。具体内容如表 1所示。 表 1 SPSS 的常用基本分析模块表模 块 作 用 子模块/进一步描述描述统计通过对数据的基本特征的描述和探索,揭示数据的特征 频率、描述、探索交叉表 以行列表的方式揭示数据间
11、关系 例如不同性别的客户在购买方面是否不同相关 分析变量之间是否有相关关系 是否正相关、负相关、无关回归 揭示变量之间的关系 分为线性回归、logistic 回归等分类 用来做客户分群 聚类、判别分析等降维 简化指标体系,前提是指标之间足够相关广泛用于市场调查、人力资源管理、经济分析等领域多重相应 分析多选题和排序题最优尺度适合于因变量和自变量都是离散型并且未必等距的情况三、统计分析基本概念统计分析中涉及的基本概念主要包括:方差和均值、置信度、离散量和连续量、 标准化、加权个案、假设检验、检验 P 值和 R 平方(R2)等。1.方差和均值方差和均值的定义方差。方差,主要是用来反映某段数据中数值
12、变量的波动状况。比如,如果 A 股大盘指数的方差很大,就说明股票市 场还不够成熟,因 为成熟的股票市 场的波动应当较小。与其相关的一个概念是标准差。均值。均值,就是多个数据的平均值。如一个公司的平均工资水平、销售的平均业绩等。方差和均值的作用方差和均值有着各自不同的作用:均值反映数据的平均水平,而方差则反映数据的波动情况。例如:对于均值相同的两个销售团队,方差小, 说明这个团队成员的销售业绩比较平均;方差大,则说明团队成员的销 售业绩差距较大,高的高,低的低。方差和均值的示例如图 5 所示,这是两个销售员的业绩数据,将 销售 1 和销售 2 放到因变量中,将自 变量保持不变,然后做一个选项。这
13、时可以忽略个案数和标 准差,只关注平均数和方差, 这时就会出来一个报告。通过报告可以看出,两个销售人员销售数据的均值相同,但 销售 1 的方差为72.727,销售 2 的方差则是 418.182,由此可以得知前者各个月度的销售额差别较小,而后者各个月份的销售额则波动很大。图 5 方差和均值数据分析示例2.置信度置信度(Confidence),也叫置信水平,它是指特定个体对待特定命题真实性相信的程度。例如,找 100 位金融行业的老总, 经过薪资收入水平调查后得出的结果是, 95%的金融行业老总的年平均收入在 80100 万元人民币,这时就可以说金融行业老总年收入在这一区间的置信度是 95%,8
14、0100 万元的区间则称为置信区间。置信区间越大,置信度就越高,例如金融行业老总在 01000 万年收入的置信区间内的置信度几乎为 100%。3.离散量和连续量离散量离散量的定义。离散量,就是一组跳跃的值。例如:某品牌或产品是否被客户接受,其结果要么是“是” ,要么是“否”,非此即彼, 这就是典型的跳跃值。离散量的分类。离散量可以分为二项(二元跳跃)、名义值和有序值三类。二项:即二元跳跃,只有非此即彼的两个值,例如 经济是否增长、是否患病、品牌是否被接受。名义值:多个值,但是其之间没有明显的排序关系,如 n 个城市、 m 个品牌。在做数据分析时,销售 团队可能分布在多个城市,或者是像宝 洁公司
15、一样有多个品牌的“ 品牌簇”,这时各个城市或品牌之间的值就是跳跃的,相互之间也没有明显的排序关系。有序值:有序列关系。例如空气质量标准欧 III、欧 IV、欧 V,这组数值之间有着明显的递进排序关系,这就是有序值离散量。 要点提示离散量的分类: 二项(二元跳 跃); 名义值; 有序值。 连续量连续量就是在数值上可以连续变的值,如年龄、啤酒饮用量、渠道 铺货率,显然都是连续量。4.标准化在数据处理时,经常会出现数据级别差异太大的情况,此时一般需要标准化,通俗地 讲,就是“把数据变 得差不多大,这样就好处理了”。例如:在统计游客数量时,人少时游客数可能是 7 人,人多时则有 2000 多人,而在
16、计算景区资金支出时,最少时是 700 元,多 时则有 4 万多元,这时就需要在 SPSS 中通过数据转换,既保留各个数值原来的特征,又让这些数据看上去差别不那么大。具体的操作路径是“ 分析”“描述统计”将四个变量 选进去勾选“将标准化得分另存为变量”, 这时就能将其另存为新的四列变量,每一列之前都加了一个“z”,这个“z 得分” 就是标准化。5.假设检验在生活中,实际上就存在很多假设检验,如在与人打交道时就经常发生这一过程。如 图 6所示。 图 6 假设检验的示例 之所以要了解假设检验,是因为在分析模型中, 经常要先做一个假设,然后再去 检验统计的量值(俗称“ 检验 P 值” )与 现实的符合
17、情况。假设检验的步骤为:第一,设定虚拟假设 H0;第二,设定对立假设 H1;第三,决定显著水平( );第四,选择适当的检验统计量,以及决定危 险域(放弃域的临界点);第五,计算所选检验统计量的观察值;第六,结论:当检验统计量的观察值落入危险域,放弃虚拟假设 H0,反之则接受。6.检验 P 值和 R 平方检验 P 值检验 P 值在 SPSS 的操作中使用极其广泛,几乎所有的检验分析过程都会用到检验 P 值。一般来说,检验 P 值低于 5%,就认为差异效果是明显的,而高于 5%,则认为差异效果不显著。例如在前文“ 置信度” 的例子中,金融老总的收入位于 80100 万区间的置信度是 95%,这时检验 P 值就是 5%(195%),在现实统计中如果要衡量 该假设是否成立,就要用该项数据与 5%的标准进行比较。R 平方在销售预测等统计分析中,很多情况下要做回归, R 平方则是回归或者曲线拟合中的重要指标,它是一个介于 01 的数,越接近 1,表示拟合效果越好。比如,在分析中做了某项预测,如果多个模型中最高的拟合值是 0.995,就表明该模型拟合效果最好,应当选择使用该模型。