1、1,第六章 市场调查资料的整理与分析,第一节 调查资料的整理 第二节 调查资料的分析,2,第一节 市场调查资料的整理,一、调查资料整理的概念 二、调查资料整理的内容 三、调查资料整理的程序,3,一、调查资料整理的概念,所谓市场调查资料的整理,就是指运用科学的方法,对调查所获得的各种原始资料进行审核、分类处理和加工综合,使之系统化和条理化,从而以集中、简明的方式反映调查对象总体情况的工作过程。,4,二、调查资料整理的内容,1、调查资料的处理(整理):包括审核、分类、汇总和制图表。2、数据管理:包括资料的输入、传输、存贮、更新与输出。,5,制定整理方案,对原始资料进行审核,数 据 处 理,制作统计
2、表或统计图,三、调查资料整理的程序,6,问卷审核,编码,数据处理,图表制作,调查问卷整理程序,录入,7,实地审核一般方式:复查和回访,1、审 核,8,调查资料审核的主要内容,(1)时效性指所填资料是否是最新资料。(2)完整性看是否有缺损问卷;是否都填写齐全;是否有答案模糊不清的问卷。(3)正确性指审核访谈是否按适当的方式进行,访问员有没有作假行为,调查口径、计算方法等是否符合要求等。,9,调查资料审核的主要方法,经验判断法例如:如果被调查者年龄填写为132岁,根据经验判断,其填写肯定有误。逻辑检查法例 如:某消费者在前面说“不知道”某调味品,后面却说“每天都在使用”,显然前后矛盾。计算审核法例
3、如:在家庭收支结构中,家庭总收入远小于总支出和储蓄之和,那肯定有错。,10,对不合格答案的的处理办法,第一,退回实施现场获取较好的数据。 第二,按缺失值处理(前提是退回实施现场的做法无法实现)。 第三,整个问卷作废(前提是不满意问卷的比例很小不足10%;样本量很大;不满意的问卷与满意的问卷间没有明显的判别 每份不满意的问卷中,不满意答案的比例很大)。,11,注意:下列问卷一般是不能接受的,第一,所回收的问卷是明显不完整,如缺一页或多页。第二,问卷从整体或部分看回答不完全。第三,调查员没有理解访问指南而误导被访问者回答,结果离题太远,如没有要求跳答。第四,同一项目的回答,答案几乎没有变化;第五,
4、问卷回收超过规定的截止日期。第六,回答问题的被访问者不符合要求。第七,答案字迹模糊不清,无法辨认。第八,对开放性的问题回答模棱两可,难以清楚表达调查意图。,12,2、编 码,编码就是给每一个问题及答案分配一个代号,通常是一个数字、字母或特殊的符号。将问卷信息转化为统一设计的计算机可识别的代码,以便于对其进行数据整理和分析。作 用: (1)减少数据录入和分析的工作量 (2)将定性数据转化为定量数据 (3)减少误差,13,安莫勒的编码与数据录入经验之谈,安莫勒是亚特兰大SDR公司的数据录入员。20年来,在管理项目数据录入方面积累了丰富的经验,他认为要在客户预算允许的范围内如期完成调研工作,重要的是
5、避免问卷中出现过多的开放型问题,这些问题的答案不能直接输入数字代码,解决的办法是根据项目分类设计编码,或将反馈内容原样录入电脑。莫勒说:“编码是数据录入过程中耗资最大且最主要的部分”。“我们读同一文本,对它的编码可能不同。如果有太多的答案需要编码,分析过程就会令人厌烦,而且理解详尽答案的花费将是非常之高的”。,14,封闭式问题的编码步骤:,第一,找出问题中的关键词。 第二,用适当的符号代表关键词,通常用拼音或英文缩写作为编码,这样便于识别;对单选题,只用一个编码,如果是多选题,它的每一个选项都应该有一个编码,这时可在统一的符号后加上序号作为各个选项的编码。 第三,确定编码的取值范围。单选题编码
6、的取值就是各选项的序号;多选题编码的取值就是0或1(选中为1,未选中为0),确定编码的取值范围有利于检查编码值的输入是否正确。 第四,检查编码是否雷同,一张调查问卷或调查表中的每一编码都应该是唯一的。 第五,编出编码表,它可与调查问题进行对照,以免遗漏,也有利于统计汇总 。,15,16,编码的主要方法,(1)顺序编码法 (2)分组编码法 (3)信息组码编码法(4) 助忆编码法(5) 缩写编码法,17,顺序编码法:又称系列编码法,用一个标准对信息资料分类,按一定顺序用连续数字或字母进行编码;简洁明了,易于管理。例如:您的性别:男 女编码:XB(1、2) 分组编码法:又称区间编码法,把一定位数的代
7、码单元分成若干个组,每一组数字代表一定意义;使用相当广泛,容易记忆,处理较方便,有时位数过多,会造成系统维护困难。例如:1242表示?,18,信息组码编码法例如:百货组从1-20、食品组从20-40 表意式文字编码法(又叫助忆编码法):指用数字、文字、符号等来表明编码对象的属性。例如:20TVC表示20英寸彩色电视机 缩写编码法例如:KG表示千克,19,3、 录 入,录入就是由录入员将问卷按照确定好的编码输入到计算机,目前主要采用键盘输入法。控制录入质量的方法: (1)重复录入 (2)预算控制 (3)平衡检测,20,4、 数据处理,处理方法: (1)自行直接人工处理 (2)委托专业机构处理 常
8、用软件: (1)Excell (2)SPSS(Statistics Package for The Social Science“社会科学统计软件”),21,5、统计表与统计图,统计表:把统计数据按一定的顺序排列在表格上,就形成了统计表。它清楚地、有条理地显示统计资料,直观地反映统计分布特征,是统计分析的一种重要工具。,22,统计表的结构,1)从表式上看 表格包括总标题、横行标题、纵栏标题和指标数值四个部分。如表1所示: 2)从内容上看 统计表由主词栏和宾词栏两个部分组成。 主词栏是统计表所要说明的总体及其组成部分;宾词栏是统计表用来说明总体数量特征的各个统计指标。 此外,统计表还有补充资料、
9、注解、资料来源、填表单位、填表人等。,23,2010年某月某公司各企业劳动生产率,横 行 标 题,主词,宾词,数据资料 (指标数值),纵栏标题,总标题,例如:,24,统计表的设计应注意事项: 1.线条的绘制。表的上下端应以粗线绘制,表内纵横线以细线绘制。表格的左右两端一般不划线,采用“开口式”。 2.合计栏的设置。 3.标题设计。以简练而又准确的文字表述统计资料的内容、资料所属的空间和时间范围。,25,4.指标数值的填写。 当缺某项数字资料时,可用符号“”表示;不应有数字时用符号“”表示。 5.计量单位。 统计表必须注明数字资料的计量单位。当全表只有一种计量单位时,可以把它写在表头的右上方。如
10、果表中各格的指标数值计量单位不同,可在横行标题后添一列计量单位。 6.注解或资料来源。 在统计表下,应注明资料来源。,26,常用的统计图,(1)直方图 用直方形的宽度和高度来表示次数分布的图形。绘制直方图时,横轴表示各组组限,纵轴表示次数(一般标在左方)和比率(或频率,一般标在右方)。 (2)折线图 折线图可以在直方图的基础上,用折线将各组次数高度的坐标连接而成,也可以用组中值与次数求坐标点连接而成 (3)曲线图 用平滑曲线连接各组次数坐标点即得分布曲线。,27,直方图,28,折线图,折线图是在直方图的基础上连接各条形顶边的中点成折线图。如下图红笔围成的,即为次数分配曲线图 :,直方图与折线图
11、,30,曲线图,31,(4)散点图、趋势图,32,(5)圆形图(饼图 Pie ),33,34,35,数据表示中的错误 Errors in Presenting Data,1. 使用花哨(Junk)图表 2. 数据比较时没有可靠的相对基准 3. 压缩纵轴 Compressing the Vertical Axis 4. 纵轴上无零点No Zero Point on the Vertical Axis,36,花哨图表 Chart Junk,不准确的表示,准确的表示,1960: $1.00,1970: $1.60,1980: $3.10,1990: $3.80,最低工资,最低工资,0,2,4,196
12、0,1970,1980,1990,$,37,压缩纵轴 Compressing Vertical Axis,季度销售,季度销售,不准确的表示,0,25,50,1季,2季,3季,4季,$,0,100,200,1季,2季,3季,4季,$,准确的表示,38,纵轴无零点 No Zero Point on Vertical Axis,月销售量,月销售量,不准确的表示,0,20,40,60,一,三,五,七,九,十一,$,36,39,42,45,一,三,五,七,九,十一,$,准确的表示,39,第二节 市场调查资料的分析,一、调查资料分析的概念 二、调查资料分析的方法,40,一、调查资料分析的概念,指对市场调查
13、与预测过程中收集到的各种原始数据进行适当的处理,使其显示一定的含义,进而反映不同数据之间以及新数据与原数据之间的联系,并通过分析,得出某些结论。,41,1、描述性统计分析法 2、解析性统计分析法(1)相关(回归)分析法;(2)聚类分析法(3)主成份分析、因子分析,二、调查资料分析的方法,42,交叉列表分析技术,交叉列表分析是同时将两个或两个以上具有有限类目数和确定值的变量,按照一定顺序对应排列在一张表中,从中分析变量之间的相关关系,得出科学结论的技术。,43,例如:电脑的拥有情况和电脑拥有者收入之间的关系,表 2 电脑的拥有情况与收入之间的关系(人数),分 析:从表中可以看出,在拥有电脑的50
14、4人中,高收入者有252人,低收入者仅有96人,这说明电脑的拥有情况似乎与收入水平有很大的关系。,44,三变量交叉列表分析技术,讨论的三变量交叉列表分析就是在双变量分析的基础上,加入第三个变量做进一步分析,可以补充说明原有两变量分析的结果,使之更准确全面。,45,三变量交叉列表分析的作用,其作用表现在: (1)更精确反映原有二变量之间的联系; (2)揭示原有的两个变量之间的不相关,也就是说三变量交叉列表分析结果显示了两者之间的相关性是虚假的; (3)加入第三个变量后,可能显示原有两变量之间被隐含的关系; (4)可能说明原有两变量之间的联系没有改变。,46,表 3 按“收入水平”和“受教育程度”分类“拥有情况”的三维联表,由表显示:大专以上的受访者中无论是高收入,中等收入还是低收入者他们的电脑拥有率都差不多,都在60%以上,而低于大专的受访者中没有拥有电脑的无论是高收入还是中低收入都在60%以上。这说明真正有相关性的变量是“受教育程度”和“拥有情况”,而不是“收入水平”与“拥有情况”,他们之间的相关性是虚假的。,