1、第二章 统计调查与整理,一、统计调查的意义,第一节 统计调查的内容与方法,统计调查,就是根据统计研究的目的、要求和任务,运用各种科学的调查方法,有计划、有组织地搜集有关现象的各个单位的资料,对客观事实进行登记,取得真实可靠的调查资料的活动过程。,(一)统计调查是人们认识社会的基本方式统计是认识社会的有力武器,而向社会作调查是正确认识社会的基本方式。人的认识是由社会存在所决定的,离开对实际情况的调查,人的认识就成了无源之水,无本之木,决不会得到正确的结论。,例:企业生存取决于市场。对企业来说,生产什么? 售价多少?何地销售?如何推广?产品市场份额多大?产品发展潜力多深?竞争对手会有什么应对策略?
2、等等,一系列问题均要通过市场调查。,请看目前:,各国企业和研究机构全年,投资于每个消费者的平均调查费,单位:美元,英国22.9,美国16.5,日本8,中国0.1,发达国家的调查公司,比如标准普尔公司和盖洛普公司,他们提供的数据,向来是世界500强制定发展战略的重要依据。,(二)统计调查是统计工作中的基础环节因为一切的统计整理和统计分析都是在原始资料搜集的基础上建立起来的。 (三)统计调查理论和方法在统计学原理中占有重要地位统计调查理论和方法包括统计调查的意义、原则、要求、统计方案的制定,各类调查方法的特点、应用条件,以及多种调查方法的结合应用等,构成了统计学原理的基础部分。,二 、统计调查的基
3、本要求,准确性是指提供的统计资料必须符合客观实际,真实可靠;,及时性是指必须按照规定的时间提供统计资料。,准确性要求和及时性要求是相互结合相互依存的,及时性在准确性要求的前提下才有意义,而准确性也不能损害及时性的要求。,三 、统计调查的设计(即统计调查方案),(一)确定调查的目的 即为什么调查?,明确调查目的是调查设计的首要问题,只有确定了调查目的,才能确定调查的范围、内容和方法,否则就会列入一些无关紧要的调查项目,而漏掉一些重要的调查项目,无法满足调查的要求。例如,2000年我国第五次人口普查的目的就规定得十分明确,即“要获得准确的人口数据,查准全国人口总数、出生率、死亡率以及流动人口状况等
4、,为科学地制定国民经济和社会发展战略与规划,制定人口政策,统筹安排人民的物质和文化生活,实现人口与资源、环境的协调发展提供可靠依据。 ”可见,确定调查目的,就是明确在调查中要解决哪些问题,通过调查要取得什么样的资料,取得这些资料有什么用途等问题。,(二)确定调查对象和调查单位 即向谁做调查?,调查对象就是我们需要进行研究的总体范围,即调查总体。它是由性质相同的许多调查单位所组成的。 调查单位是进行登记的标志表现的直接承担者。例:人口普查的调查单位是每一个人。,注意调查单位与填报单位 的区别:,当调查单位自己负责向上报告时,它同时也是填报单位;当调查单位的资料由它的上级组织收集整理并向上报告时,
5、填报单位与报告单位则不一致。,(三)确定调查项目,拟订调查提纲和制定调查表 即调查什么?,拟订调查项目时要注意几个原则:,-调查项目要少而精; -本着需要和可能的原则,只列入能够得到确定答案的项目; -尽可能做到各个调查项目之间有一定的联系。,调查表分为:,把许多调查单位和相应的项目按次序登记在一张表格里。这便于汇总,但缺点是调查项目不能太多,故调查深度不够;,将一个调查单位的项目登记在一份表或一种卡片上。这便于容纳较多的项目,且便于整理、分类,缺点是每份表格上都要登记一些共同事项,造成人力和时间的浪费,也使调查工作比较繁琐。,表名、编号、调查单位的名称、性质、隶属关系等,调查表的主体,包括调
6、查项目和调查项目的具体表现等,填报人、备注、指标解释等,调查表的基本结构:,部门提供的法人和产业活动单位情况名录表,单位负责人: 填表人: 报出日期:年 月 日 说明:1.本表范围是报告期内部门登记的全部法人单位和产业活动单位或分支机构。 2.本表提供时间为2008年7月31前;提供方式为磁介质。 .登记机关代码:A清查数据;T统计部门;G工商部门; B机构编制部门;,住户调查表省码 县(市、区)码 乡(街道)码 行政村(小区)码 村民小组码 住户编码 住户属性01 02 01农村住户 02非农村农业经营户 二、住户经营类型 1、2006年收入主要来源(50%以上) 01农业 02非农业 2、
7、2006年农业收入主要来源(单选) 01农业 02林业 03畜牧业 04渔业 05农业服务业 3、2006年经营何种非农行业(多选) 01没有 02工业03建筑业 04交通运输业 05批发和零售业 06住宿和餐饮业07其他 4、是否参加农村专业性合作经济组织 1是 2否 5、是否有营业执照 1.有 2.没有 家庭年收入情况(在相应的栏内写上1),科普人员,省(自治区、直辖市) 地(市、州、盟) 县(区、市、旗) 批准文号:国统制2008134号 行政区划代码:_ 有效期至:2009 年10月 综合机关名称: 联系电话: 机构主管部门类别代码(见附录): 单位级别:中央部门 省级 地市级 县级,
8、表 号:KP-001 制表机关:科 学 技 术 部 批准机关:国 家 统 计 局,表 号:KP-001 制表机关:科 学 技 术 部 批准机关:国 家 统 计 局,表 号:KP-001 制表机关:科 学 技 术 部 批准机关:国 家 统 计 局,表 号:KP-001 制表机关:科 学 技 术 部 批准机关:国 家 统 计 局,调查问卷:,指非政府性统计机构或个人所从事的对人的主观意见的调查工作,也称作民意调查或民意测验。,调查问卷的基本格式:,说明词:解释调查意义、表达感激之情等,主题问句:被调查者基本情况、调查项目,作业记录:编码、时间、操作者等,填表说明:填表方法,要求,注意事项,1 封面
9、信 (WWH三原则)首先 要说明调查者的身份(who)。其次 要说明调查的大致内容和进行 这项调查的目的(why); 最后 要说明调查对象的选取方法和对调查结果保密的措施(how)。,福州大学研究生择业观调查问卷 亲爱的同学们:你们好!首先请原谅打扰了你们的学习和休息!近些年,随着研究生毕业人数的急剧增加,研究生毕业就业问题也成为全社会关注的热点问题。为了更好的了解当前研究生的就业心态,让在校研究生的择业观更加明确,使个人预期与社会需求之间差异最小化,以便为广大同学在求职时提供更好的参考意见。我们特别组织了这次调查,希望能够得到你们的支持与合作!本调查表不用填写姓名,各种答案没有正确、错误之分
10、。本问卷不对外公开,请如实填写。祝大家身体健康、万事如意!福州大学公共管理学院社会调查组 2007年11月5日,2 指导语,指导语是用来指导被调查者填写问卷的一组说 明.其作用与仪器的使用说明书相似,有些指导语集 中在封面信之后,并标有“填表说明”的标题,其作用 是对填表方法,要求,注意事项等作一个总体说明。 例如: 填 表 说 明1. 请在每一个问题后适合自己情况的答案号码 上画圈或者在_处填上适当的内容.2. 问卷每页右边的数码及短横线是上计算机用 的,您不必填写.3. 若无特殊说明,一个问题只能选择一个答案. 4. 填写问卷时,请不要与他人商量.,3 问题与答案,问题与答案是问卷的主体。
11、问题从形式上看,可分为非限定回答式(开放式)和限定回答式(封闭式)两类。非限定回答式问题 是不为回答者提供具体答案,而由回答者自由填答。限定回答式问题 就是在提出问题的同时,还给出若干个答案,要求被调查者选择一个或几个作为回答。,例:(1)您对我国医疗体制改革有什么看法?(2)您认为您在就业市场上最大的劣势或不足是:_。外语等非本专业知识 专业知识水平专业热门度 社会关系 学校知名度 工作经验 其它_,4 编码及作业记录,所谓编码就是赋予每一个问题及 其答案一个代码,编码的工作既可在 问卷设计时就设计好,也可等调查完 成后再进行,前者称为预编码,后者称 为后编码.作业记录:调查的时间、操作者等
12、。,提问问题的格式,(一)非限定式问题非限定式问题只提出问题,不提供任何答案,而由被调查者自己填写。,(二)限定式问题限定式问题包括问题及答案两部分,其形式主要有下面几种:,1. 填空式 即在问题后面划一短横线,让回答者填写。 性别 :_ 年龄 :_ 文化程度:_ 职业:_填空式一般只用于那些对回答者来说既容 易回答也易于填写的问题,通常只填数字。,2. 两项式,答案只有“是”和“不是”(或者其他肯定和否定形式)两种。回答者根据自己的情况选择其一。如: 您是共青团员吗? 是 不是 您住在本市吗? 是 不是 您家有空调吗? 有 没有 您赞成学分制吗 ? 赞成 不赞成两项式问卷是在民意测验的问卷中
13、使用得最多的一 种,其特点是回答简单明了,可以严格地把回答者分成两 类不同的群体,但其弱点是得到的信息量太小,两种极端 的回答类型不能了解和分析回答者中客观存在的不同层 次。,3.多项单选式,给出的答案至少在两个以上,回答者根据自 己的情况选择其一,这也是问卷中采用最多的一 种问题形式。例: 您期望选择的就业单位是: _ A、民营企业 B、 国有企业 C、三资企业 D、自主创业 E、政府部门 F、事业单位 G、高校 H、其它,4. 多项限选式,指在所列举的多个答案中,要求回答者根据自己情况从中选择若干个。 例:在求职的过程中您倾向于选择哪个途径求职?(可多选):_。 A、现场招聘会或校园招聘会
14、 B、网上求职 C、亲友介绍 D、上门推销 E、其它 _多项限选式比多项选一的方式更能反映被调查者的实际情况,但是我们无法从答案中看出被选择的顺序,无法区分选项间的程度差别.,5.多项排序式,在所例举的多个答案中,选择两个以上的答案,并且要求被调查者为自己的选择答案排序. 例:您对这些科普场所的喜好程度的排序是:第一_; 第二_;第三_。 A、科技馆 ( ) B、博物馆(院) ( ) C、科普教育基地( ) D、海洋馆( ) E、动物园( ) E、科普宣传橱窗、画廊( ) F、社区科普活动室( ),6.多项任选式,多项任选式是在所提供的答案中,被调查者可以任意选择各种不同数目答案的一种问题形式
15、. 例:您在平时从以下哪些科普媒介接受科普知识(可选择多项)? A、科普报刊 ( ) B、广播 ( ) C、电视( ) D、科普图书 ( ) E、科普影片( ) F、互联网络科普( ) 要将每一个答案都看成一个变量,都给一个编码,这样此例中就有8个变量,编码时也就要给8个编码。,7.矩阵式,这是一种将同一类型的若干个问题集中在一起,构成一组问题的表达方式。 您认为当前最严重的社会问题是什么?(请在适当的方格内打) 非常严重 比较严重 一般 不太严重 无所谓 不知道 下岗失业问题 口 口 口 口 口 口 社会治安问题 口 口 口 口 口 口 贫富分化问题 口 口 口 口 口 口 国民素质问题 口
16、 口 口 口 口 口 官员腐败问题 口 口 口 口 口 口 社会公德问题 口 口 口 口 口 口矩阵式的优点是节省问卷的篇幅,同时把同类问题放在一起,回答方式又相同,也节省了回答者阅读和填写的时间。,8表格式 这是矩阵式的一种变体,其形式与矩阵式十分相似。 例:您对福建电信的下列服务看法如何?(请在所选方框内打),表格形式的问题除了具有矩阵形式的特点外,还显得更为整 齐、醒目。但是应当注意的是,这两种形式虽然具有简单集中的优点,也同时使人产生呆板,单调的感觉,在一份问卷中这两种形式的问题不易用得太多。,(三)混合型回答,2008年您订阅过科普报刊吗? A、没有( ) B、有( ),它们是 。,
17、1、要认识问卷设计的出发点。问卷是研究者在调查中用来收集资料的工具,所以设计问卷应该要考虑研究的需要。但是首先应认识到,方便回答者是设计问卷的出发点,应尽力为他们回答问卷提供方便。,调查问卷设计的基本要求:,2、问卷的问题必须围绕假设进行设计。 设计者对问卷的设计应当有一个总体框架,对设计的每一个问题所起的作用应十分清楚,对一个理论假设需要哪些指标来测量,也应十分明确。,3、问题的表述要清楚。 (1)每个问题要规范化、标准化,即问卷上提出的每个问题、变量和指标要有明确的规定,要使所有的回答者作出一致的正确理解。 (2)一句话只问一件事,不能一句两问。 例:“您对xx产品的价格和服务质量满意还是
18、不满意?”,(3)提问不能带有暗示,即不能带有感情色彩和倾向性。 例:购买盗版制品是不道德的,你是否购买过盗版制品。 (4)问题间的承接要清楚。,您是否吸烟(如果选,则跳过、 题)吸烟 不吸 您每天大约吸多少支烟 5支以下 5-10支 10-15支 15-20 20-25支 25支以上 您的吸烟历史大约有多长 1年以下 1-5年 5-10年 10年以上 您是否认为吸烟有害健康(请写出理由),4、所列问题不能超出回答者的能力。 包括识别文字和理解文字的能力,知识的范围和水平。 5、问卷中的问题应尽量避免社会禁忌和敏感性问题。 如“您家有多少存款?” “您得过肝炎吗?”,6、问题的排列顺序要恰当。
19、要先易后难、先封闭后开放、先基本问题后派生问题。7、文字应尽可能简明扼要。8、限定式问题(封闭式)问题中的答案要符合相关性、同层次、穷尽性和互斥性原则。,相关性原则 例:在求职的过程在您会选择哪个途径求职?( ) A、父母期望 B、个人抱负 C、工作地点方便 D、专业对口 E、待遇优厚,同层次原则 例:你选择在那些类型的单位就业?( ) A、国有企业 B、 外资企业 C、 港澳台资企业 D、 民营企业 E、 政府和公共机构 F、学校和科研机构 G、银行 H、会计师事务所,穷尽性原则 例:您每个月的生活费: ( ) A. 500元以内 B.500元-800元 C.800元-1000元,互斥性原则
20、 例:您看完韩剧后最喜欢的韩国产品是?( ) A、电子产品 B、服装和小饰品 C、护肤品和化妆品 D、韩国菜 E、食品,(四)确定调查时间 即在什么时间调查,要区别调查时间和调查期限的不同:,调查时间是指调查资料所属的时间(时点或时期); 例:2010年11月1日零时为第六次全国人口普查登记的标准时间。 调查期限是指调查工作的起讫时间。 例:人口普查的现场登记工作, 从2010年11月1日开始到 11月15日以前结束。,(五)制定调查的组织实施计划,调查工作的组织实施计划包括组建调查机构、安排调查工作步骤、组建调查队伍和进行人员培训、确定经费预算和来源等。,直接观察法:,现场对被调查对象点数和
21、计量,报告单位利用原始记录和核算资料 向有关单位提供统计资料,报告法:,采访法,询问法,通讯法,网上调查法:,利用网络收集统计资料的方法,(六)选择调查方法,统计调查的方法:搜集调查对象原始资料的方法。,统计调查方案的设计实例,问卷的设计实例,按调查对象包括的范围分类,按登记事物的连续性分类,按调查的组织形式分类,为了一定目的,研究某些专门问题所组织的一种调查方式,第二节 统计调查的组织(即调查的种类),指按照国家统一规定的各项要求,自下而上地定期向国家和主管部门报送基本统计资料的一种报告制度,统计报表 制度,优点,局限,统计报表是我国定期搜集基本统计资料的一种重要的组织形式。,-按报送周期长
22、短不同统计报表分为:,-按实施范围分为国家统计报表、部门统计报表、地方统计报表。,-按调查范围分为全面统计报表和非全面统计报表,-按填报部位分为基层报表和综合报表。,-按报送方式分为电讯报表和书面报表。,指国家为详尽了解某项重要的国情国力而专门组织的一次性全面调查,作用,局限,由于需要大量的人力、物力和财力,不宜经常进行,普查,为了适应我国改革开放和建立社会主义市场经济体制的需要,从根本上改革统计调查体系,国务院于1994年7月20日批转国家统计局关于建立国家普查制度,改革统计调查体系的请示(国发199442号),明确了普查在统计调查体系中的基础地位,正式确立国家周期性普查制度。(1)人口普查
23、每10年进行一次,逢0年份进行;(2)农业普查每10年进行一次,逢6年份进行;(3)工业普查、第三产业普查和基本单位普查合并,再加上建筑业,共四项工作一起进行,统称为经济普查。在2004年进行了第一次全国经济普查。全国经济普查每10年进行2次,分别在逢3、逢8的年份实施,这与国家编制五年计划的衔接更加紧密。,人口普查,人口普查的历史,早在公元前年,古巴比伦王国就举办了全国性调查,按族登记人口。 中国是世界上最早进行人口统计的国家之一,也是唯一有长期不间断人口资料记录的国家,当时人口统计主要用作征兵、征发劳役和赋税的一种依据。据后汉书记载,公元前年,大禹曾经“平水土、分九州、数万民”。当时“数万
24、民”的结果是万人。,人口普查的历史,美国在年进行的第一次人口普查被认为是现代人口普查的开始。,人口普查的历史,年,中国政府颁布了户口调查统计报告规则,进行人口调查。但由于当时的政府几乎没有进行任何组织和技术上的准备,普查失败了。 年、年、年和年又多次提出了人口普查的计划,由于抗战、政权更替等原因都搁置了。,人口普查的历史,新中国成立后先后于1953年、1964年和1982年进行过三次全国人口普查。三次人口普查的时间都确定为7月1日零时。 1990年我国进行了第四次人口普查,这次普查与联合国关于1990年人口普查的建议相一致。 2000年我国进行了第五次人口普查,人口普查的方法,美国的人口普查主
25、要通过派发问卷、邮寄返回的方式进行 中国则与世界上大多数国家一样,人口普查采用入户调查的方式,必须统一规定调查资料所属的 标准时点,2000年11月1日零时为第五次全国人口普查登记的标准时间。这并不说明普查登记只在11月1日零时进行。第五次全国人口普查办法第十九条规定:“人口普查的现场登记工作,从2000年11月1日开始到11月10日以前结束”。 2000年11月1日零点以后出生的人口,都不是此次人口普查对象;如果家中有人在11月1日零点病重,当普查员11月1日以后到家中登记时,这个人已经去世,此人仍为普查对象;如果家中有人在11月1日零点以后迁入,当普查员到家中登记时,居民不应该把此人作为家
26、中常住人口申报,这个人应该回到户口迁出地进行普查登记。,正确选择普查时期,我国前四次人口普查都选在月日时进行,“五普”把时间改在月日时,是有其科学原因的:每年、月份全国不仅天气炎热,而且常伴有特大暴雨洪灾,各级政府和群众大多忙于防洪、抢险、救灾,给普查带来一定困难;冬季北方地区太冷,也不利于普查,所以选在月上旬。此外,“常住人口”的时间标准定为半年,按以往把普查的时间选在月日,许多外出打工的农民过完春节回到城里都不到半年,他们仍按住在农村被登记,无法反映当前人口流动的现状,选在月也可以避免这个矛盾,使普查数据的可用性大大增加。,在普查范围内各调查单位或调查点尽可能同时进行调查,1990年我国第
27、四次人口普查调查登记时间规定在十天之内完成,调查项目一经确定不能任意改变或增减,人口普查对我国的意义,为国家宏观决策和发展社会经济服务 我国是一个幅员辽阔、人口众多的大国,建设和管理好国家的首要条件是把基本国情搞清楚。而人口是最重要、最基础的国情,这个家底不摸清,国家制订经济和社会发展计划就失去了基础,研究和做出重大决策时就会带有盲目性。,人口普查对我国的意义,为贯彻计划生育基本国策服务 上世纪90年代以来,我国的总生育率一直保持在更替水平和更替水平以下,人口过快增长势头得到了有效控制,尤其是1998年我国人口自然增长率首次降至1以下,开始进入低水平国家之列,实现了从高出生、低死亡、高增长到低
28、出生、低死亡、低增长的人口再生产类型的历史性转变。,人口普查对我国的意义,为合理安排劳动就业和发展教育文化事业服务 我国劳动力资源丰富。建立社会主义市场经济体制以来,国企深化改革、调整产业结构,积极扶持和发展个体及私营企业、股份制企业,使我国的行业、职业人口分布发生了较大的变化。人们的择业观念也在不断改变,特别是大量农村剩余劳动力向城市转移,使我国劳动力市场发生了较大变化。通过第五次全国人口普查,全面了解我国10年就业结构发生的变化,经济活动人口的状况,对于更加充分合理利用劳动力资源,调整产业结构,将起到很大作用。,我国第五次人口普查,第五次人口普查在普查指标的设计、普查登记统计方法上,都尽量
29、与国际接轨,主要体现在: 普查年份的选取。按国际惯例,人口普查一般是逢“”逢“”进行。我国前四次普查分别在、和年,相隔的时间不同,数据不适于纵向比较。“五普”选在相隔“四普”年以后的年进行,最具有科学性。,我国第五次人口普查,先进的指标体系。“五普”分为“按户填报项目”项和“按人填报项目”项,比“四普”增加了项。 “按人填报项目”增加了人口迁移的内容,如“出生地”、“何时从何地来本乡镇街道”等。“何时从何地来本乡镇街道”不是指户口的迁移,而是人们实际居住地的变化,可以反映改革开放以来人口流动量大的实际情况。“按户填报项目”主要增加了住房的内容。 第一次在普查中加进住房项目。普查员询问“你家是喝
30、自来水还是另行购买的桶装饮用水?”、“洗澡是用统一供的热水、自家热水器还是凉水?”、“你家有厕所吗?是独立的还是和邻居合用的?有抽水马桶吗?”,我国第五次人口普查,使用长短表技术。并非所有人都要回答上面所有的问题。为了尽量获得全面的信息,又尽可能减少投入,普查将设计两种普查表长表和短表。通过抽样方法选出的住户填报长表,长表的内容最全面,包括上述的“按户填报项目”项和“按人填报项目”项共项。其他的住户填报短表,“按户填报项目”九项和“按人填报项目”项共项。长表包涵了短表,用于抽样调查统计。,我国第五次人口普查,首次采用光电录入技术。对普查数据的整理汇总,“一普”用的是算盘,“二普”用的是手摇计算
31、器,“三普”、“四普”有了计算机,但也要人眼识别、人手键入,难免出现二次误差。“五普”首次采用光电录入,普查表的设计类似全国统考的标准化答卷卡,由计算机自动识别普查表的内容,节省了时间和人力,也提高了准确率。据悉,“四普”从普查到最终出结果,用了一年零四个月;“五普”采用光电录入后,只要八个月就统计完毕。,“五普”准备工作,(1)划分普查区。每个普查区,按照一个普查员所能承担的工作量,划分成若干个调查小区,涵盖调查小区的所有住户,不重不漏。 (2)户口整顿。在查点前,主管我国户口登记的机关按照户口登记条例及其他有关人口管理的规定进行户口整顿,整顿包括查清常住人口、暂住人口和流动人口数量,以便查
32、点时有名单作依据。 (3)摸底工作。人口普查登记前,要求普查员、普查指导员对调查小区的人口进行摸底,明确普查的职责范围,绘制调查小区地图,编制调查小区各户主姓名底册。,相关资料,相关资料,相关资料,为了解总体基本情况,在调查对象中只选择一部分重点单位 进行调查的一种非全面调查组织方式,作用,局限,能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料,只适用于客观存在着重点单位的情况,重点调查,这些单位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体的基本情况,例:某地区为了掌握该地区水泥生产的质量情况,拟对占该地区水泥总产量80%的五个大型水泥厂的生产情况进行调查,属于重点调
33、查。,典型调查,在对调查对象有一定了解的基础上,有意识地选择少数典型单位 进行调查的一种非全面调查组织方式,不能确定推断的把握程度,无法计算和控制推断误差,作 用,指在数量表现上具有普遍意义和代表性的总体单位,可以用来推断总体的数量,局 限,按照 随机原则 从调查对象中抽取一部分样本单位进行调查,再用样本资料推断把握总体的数量特征的一种非全面调查组织方式,抽样调查,指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会,特 点,优 点,总体单位,调查单位,总体单位,调查单位,普 查,对全部单位进行调查,总体单位,调查单位,重点调查,只调查重点单位(单位数不多但其标
34、志量占标志总量比重较大的单位),总体单位,调查单位,典型调查,对典型单位进行调查,典型单位的选择并不一定按规模,总体单位,调查单位,抽样调查,按随机原则选择调查单位,各单位被选中的机会相同。,我国统计调查方法体系改革的目标模式是:,建立以周期性普查为基础,以经 常性的抽样调查为主体,以必要 的统计报表、重点调查、综合分 析等为补充,搜集、整理基本统 计资料的统计调查方法体系模式,一、统计整理的意义和内容,第三节 统计分组,1、对调查资料进行审核; 2、按汇总要求进行分组或分类; 3、对各单位的指标进行汇总和作必要的加工计算; 4、编制统计表; 5、统计资料的积累和保存。,内容,制定统计整理方案
35、,对原始资料进行审核,数 据 处 理,制作统计表或统计图,统计整理的步骤,1.概念 根据统计研究的需要,将统计总体按照一定的标志区分为若干个组成部分的一种统计方法。其目的是把同质总体中的具有不同特点的单位分开,把性质相同的单位合在一起,研究现象的数量表现和数量关系,从而正确地认识事物的本质及其规律性。,二、统计分组的概念和作用,2.作用 主要有三个方面:,划分社会经济现象的类型,反映各类型的特点。, 类型分组,单位:亿元,揭示社会经济现象的内部结构和比例关系。, 结构分组,分析社会经济现象之间的相互依存关系。, 分析分组,某乡某种农作物的耕作深度与收获率的关系,总体经过分组,能够突出组与组之间
36、的差异而抽象掉组内各单位之间的差异,使数据变得条理化,便于进一步分析研究。,选择分组标志,确定分组体系,总体单位归类,科学性:组间差异大,组内差异小。,完备性和互斥性:每个单位均能且只能归到某个组中。,3、统计分组的程序与原则:,对大学生月生活费支出情况进行分组研究: 按家庭收入水平分组; 按城乡分组; 按性别分组; 按年龄分组。,统计分组的程序与原则,对父母亲下岗情况进行分组研究:单亲下岗; 双亲下岗; 双亲在岗。,不符合科学性,不符合完备性和互斥性,三、选择分组标志的原则,根据研究问题的目的来选择,要选择最能反映被研究现象本质特征的标志,要结合现象所处的具体历史条件或经济条件来选择,品质标
37、志分组 反映事物属性差异,四、 分组标志的种类,1.按分组标志的特征不同分为 :,- 简单分组。如人口按性别分组。 - 复杂分组,亦称分类。如人口按职业分组。,- 单项式数量分组 运用于变量变动幅度 小、项目少的分组。 - 组距式分组 运用于变量变动幅度大、项目多的分组。,数量标志分组 反映事物数量差异,品质标志分组 反映事物属性差异,四、 分组标志的种类,1.按分组标志的特征不同分为 :,- 简单分组。如人口按性别分组。 - 复杂分组,亦称分类。如人口按职业分组。,- 单项式数量分组 运用于变量变动幅度 小、项目少的分组。 - 组距式分组 运用于变量变动幅度大、项目多的分组。,数量标志分组
38、反映事物数量差异,2.按总体所选择分组标志的个数分 :,简单分组 按一个标志对总体进行分组 复合分组 按两个或两个以上标志层叠起来对同一总体进行分组,对社会经济现象需要从各方面进行观察和分析研究,需要采用一系列相互联系、相互补充的标志对现象进行多种分组,这些分组结合起来构成一个体系,叫做分组体系。,各分组标志并列使用,各分组标志交叉结合使用,平行分组体系,对教师的分类,按性别分类,男性,女性,按职称分类,按年龄分类,高级,中级,初级,青年,中年,共计7组 2+3+2,交叉分组体系,按性别分类,按职称分类,按年龄分类,男,女,高级,中级,初级,青年,中年,共计12组232,对教师的分类,第四节
39、分配数列,一、分配数列的概念和种类,某班学生的性别构成情况,组别 次数 频率, 品质数列, 变量数列,单项变量数列(单项数列) 按每 个变量值分别列组编制数列,适用于 不连续变量或变量能以整数表示,其 变动范围不大时。,组距变量数列(组距数列) 按组 距分组编制数列。适用于连续变量或 非连续变量、其变动范围较大时。,某厂第二季度工人平均日产量,组别(变量) 次数(频数),2007年全国家庭按人口数分组,组别(变量) 次数(频数) 频率(比率),某企业职工按月工资分组,居民家庭按人均月生活费收入分组,等距数列,2005年我国人口按年龄分组,异距数列,从另一角度看,变量数列分为:,连续变量数列 可
40、有小数,采取组距式。,非连续变量数列 整数,采取单项式或组距式 (例:一个地区的 企业按职工人数分组)。,连续变量数列,非连续变量数列,同时 具备,二、变量数列的编制,【例】己知某车间有24名工人,他们的日产量(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。,编制结果如下:,变量值变动区间的长度相等,变量值变动区间的长度不完全相等,相关概念,某地区100个百货商店 月销售额与流通费用情况,上组限U,下组限L,如:组距d=U-L =100-50=50(万元)
41、,如:组中值x=(U+L)/2 =(100+200)/2 =150(万元),编制等距数列,适用于总体单位的标志值变动比较均匀的情况,实例,己知某地区某年50个商店商品销售额的资料如下(单位:百万元):7.4 12.6 29.0 2.0 12.4 7.0 14.8 17.5 15.0 18.2 18.7 15.5 12.8 26.0 17.3 8.3 14.7 12.0 3.5 6.8 25.0 19.3 6.4 4.0 11.9 8.5 13.2 14.5 17.1 15.6 13.4 4.5 9.5 20.0 15.7 6.0 11.4 23.0 14.2 16.7 21.0 16.0 13
42、.6 10.0 13.9 5.0 5.8 10.5 16.3 22.0 要求编制组距数列。,编制步骤:,1、将各变量值按一定的顺序排列,2、求变异全距,3、确定组距及组数,R组距(d) 组数(m),计算组数(组数不宜过多,也不宜太少),上例中,取d=5,则有,4、确定组限,哪种更好?,商店按商品销售额分组情况表,商店按商品销售额分组情况表,开口组距数列组中值的计算:,首组假定下限首组上限相邻组组距末组假定上限末组下限相邻组组距,先计算开口组的假定上、下限:,因此有:,商店按商品销售额分组情况表,三、次数分布与累计次数分布,总体中各组单位数在各组间的分布,称为次数分布。次数分布是统计研究的一个基
43、本课题,通过次数分布规律,可以研究大量现象的统计规律性。,商店按商品销售额分组情况表,次数,频率,在直方图的基础上连接各条形顶边的中点成折线图。 如下图红笔围成的,即为次数分配曲线图:,累计次数(频率),从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累计,说明某一组上限以下各组的累计次数(频率)。,从变量值高的组开始,将各组次数(频率)逐次向变量值低的组累计,说明某一组下限以上各组的累计次数(频率)。,频数表 (用SPSS制作),有效数据,频数,频率,有效频率,累计频率,约2/3的人身高不超过165cm,(一)钟型分布 1、对称分布,也称正态分布,对称型,常见的次数分布主要有三种类型
44、:钟型分布、U型分布、J型分布。,变量值,次数,Y,Y,右偏型 (上偏型),左偏型 (下偏型),X,X,2、偏态分布,也称偏态曲线,2005年福建省高考理工科各分人数,(二)U型分布,反J型分配曲线,U型分配曲线,(三)J型分布,正J型分配曲线,双峰曲线,从形式上看:统计表由总标题、横行标题、纵栏标题、指标数值构成。,从内容上看:统计表由主词和宾词两部分构成。,说明总体或总体的分组。,用哪些指标数值来说明总体或总体的分组。,一、统计表的结构和内容,第五节 统计表,2005年某月某公司各企业劳动生产率统计表 单位_,横 行 标 题,主词,宾词,总标题,纵栏标题,数据资料 (指标数值),二、统计表
45、的特点,开口式 上下有基线 编号:主词一般按A、B、C,宾词按1、2、3 有计量单位 表中不允许有空格:若不需要此资料则用“-”;暂缺某资料则用“”,三、统计表的分类,某年某公司所属两企业自行车合格品数量表,某年某地区工业增加值和职工人数,四、统计表的编制原则,1. 总标题须简明扼要表达出全表的内容; 2. 各标题要确切反映表的内容,且表格安排合理; 3. 指标数值要位数对齐,合计或总计一般放在表的尾部; 4. 对指标内容作必要说明时,可加注在表的下方; 5. 表的上下边线(基线)用粗实线或双线,表的两边是开口式; 6. 纵栏较多时编栏号,指标数值栏要注明计量单位和资料表示的时间。 总原则:合理、科学、实用、简练、美观。,第六节 统计图,一个图只用来显示一种现象的数量特征,几种常用的统计图,几种常用的统计图,条形图(Bar),用于显示离散型变量的次数分布,几种常用的统计图,条形图(Bar),用于显示离散型变量的次数分布,条形图(Bar),用于显示离散型变量的次数分布,直方图,条形图,折线图还可用来表示累计次数分布,向下累计,向上累计,End of Chapter 2,