1、第二章 数据搜集与整理,统计调查,统计整理,统计分析,有组织、有计划地搜集资料。要求:准确、完整、及时,对调查资料去伪存真、去粗取精、科学分类、浓缩简化,描述性分析推断分析、决策分析。要求:定性定量结合,统计工作的三个中心阶段,统计调查,一、调查组织方式,案例,统计调查,二、调查方案设计,报表制度,普 查,重点调查,典型调查,抽样调查,方案内容,调查表、问卷设计,制度化的经常性调查,专门组织调查,全面调查,非全面调查,网上调查,一、统计调查的组织方式,统计报表制度,由政府部门组织,采用统一的表格,自上而下布置,自下而上报告。,任务:,搜集国民经济和社会发展基本情况的资料,为制订国民经济和社会发
2、展计划和检查计划执行情况服务。,优点:,精心周密设计、高度统一、规范。回收率高,内容相对稳定,便于资料积累、对比。层层上报、逐级汇总,可以满足各部门需要。,特点:,普查,特点:,工作量大,时间性强,需要大量人力和财力。,任务:,搜集重要的国情国力和资源状况的全面资料,为政府制定规划、方针政策提供依据。,方式:,建立专门机构,配备专门人员调查。,利用基层单位原始记录和核算资料发表调查。,原则:,规定统一的标准时点。,规定统一的普查期限。,规定调查的项目和指标。,重点调查,特点:,在总体中选择个别或部分重点单位进行调查。,任务:,及时了解总体基本情况,为主管部门指导工作服务。,方式:,一次性调查;
3、专门设计和备配人员现场调查。,重点单位指在总体中有举足轻重地位的单位,其标志值在总体标志总量中占有绝大比重。,经常性调查;同报表制度结合,用统计报表调查。,典型调查,特点:,在全面分析的基础上,有意识地选择代表性的典型单位进行现场调查。,任务:,为研究某种特殊的社会经济问题,搜集详细的第一手资料,借以认识事物的本质特征、因果关系、变化趋势。为理论和政策性问题研究提供依据。,作用:,适宜于研究处于萌芽状态事物和倾向性问题;,适宜于分析事物的类型,它们之间的差别和关系。,方法:,解剖麻雀;划类选典;抓两头。,抽样调查,特点:,1按随机原则从总体中抽取样本;,2以样本指标(统计量)为依据推断总体参数
4、 或检验总体的某种假设;,3抽样误差可以事先计算并加以控制。,调查误差,登记性误差,代表性误差,偏 差,随机误差,抽样平均误差,实际误差,统计推断中的抽样误差就是抽样平均误差。它是处于调查所固有的,是对抽样推断精确度的量度。,抽样调查的组织方式:,1简单随机抽样(纯随机抽样),方法:将总体单位编成抽样框,而后用抽签或 随机数表抽取样本单位。,适用:总体规模不大;总体内部差异小,2类型抽样(分层抽样),方法:将总体全部单位分类,形成若干个类型组,然后从各类型中分别抽取样本单位,组合成样本。,总体N,样本n,等额,等比例,最优,3等距抽样(机械抽样),方法:将总体单位按某一标志排序,而后按一定的间
5、隔抽取样本单位。,排序依据的标志:(1)无关标志;(2)有关标志,(总体单位按某一标志排序),4整群抽样(cluster sampling),方法: 将总体全部单位分为许多个“群”,然后随机抽取若干“群”,对被抽中的各“群”内的所有单位登记调查。,例:,优点:组织工作简便,费用节约。局限性:调查单位过于集中在少数样本群中,限制样本在总体分布的均匀性。适用于两类现象:一类是根据行政、地域或自然形群体;另一类是连续不断的总体。与类型抽样的区别:主要是抽样目的有区别。为了维护本课件多媒体的版权,本网站仅上传每章节若干页讲义,望大家谅解。,Excel的直方图分析,直方图是描述统计的图解方法,它与其它统
6、计定量方法相辅相成 ,共同完成汇总、揭示数据分布特征的任务。但它们一般不能正确估计总体特征(除非满足抽样有关的统计假定)。以第2章习题1为例 ,说明应用Excel进行统计频率分布和直方图等操作的步骤 。1进入Excel并打开新工作簿,在A单元列中逐个输入原始数据,在B单元列中输入各组的分组上限,不管连续性变量还是离散性变量,分组的频数都只计算到各组上限包括的变量值数目为止。一般均取“10”的倍数减1,而分组的下限将默认为“10”的倍数。2输入原始数据。在B1单元中输入标志名称,在B2单元中输入“59”(说明在小于和等于“59分”的变量数计在第一组的频数内,等于“60分”的变量数将计到下一组的频
7、数内),作为第一组的分组上限,在B3单元中输入“69”作为第二项数据,依此输入。3从工具菜单中下拉,选择数据分析直方图点击确定按钮。 4在直方图分析选项框的“输入区域(I)”中输入含有原始数据单元范围的引用(A1:An),本例为$A$1:$A$51,更为简便的是直接用光标圈选A列的数据。此外,如果引用范围包括标志值的名称,必须勾选“标志”选项。,5在“接收区域”中输入含有分组单元的引用(B1:Bn),输入包含有分组标志值单元范围的引用,本例为$B$1:$B$7,通常这些分组区间的界限(上限)必须按升序排列。 6在“输出区域”中输入想让输出表显示其范围的左上角单元引用(必须是空的单元),注意防止表格与图表以及原始数据的覆盖和重叠。本例取$D$1。勾选“图表输出(C)”复选框,单击确定。输出如下图表 。,