收藏 分享(赏)

统计学课件第二章-统计调查与统计整理.ppt

上传人:无敌 文档编号:638957 上传时间:2018-04-16 格式:PPT 页数:160 大小:1.85MB
下载 相关 举报
统计学课件第二章-统计调查与统计整理.ppt_第1页
第1页 / 共160页
统计学课件第二章-统计调查与统计整理.ppt_第2页
第2页 / 共160页
统计学课件第二章-统计调查与统计整理.ppt_第3页
第3页 / 共160页
统计学课件第二章-统计调查与统计整理.ppt_第4页
第4页 / 共160页
统计学课件第二章-统计调查与统计整理.ppt_第5页
第5页 / 共160页
点击查看更多>>
资源描述

1、1,第二章 统计调查与整理,第一节 统计调查的意义和种类 第二节 统计调查方案的设计 第三节 统计调查的组织方式 第四节 统计分组 第五节 分配数列 第六节 统计表,2,一、统计调查的意义(一)统计调查的概念 按照统计任务的要求,运用科学的调查方法,有组织地向社会实际搜集各项原始资料的过程。,(二)统计调查的意义 1)认识社会的基本方式 2)统计工作的基本环节 3)其理论和方法在统计学原理中占重要位置,第一节 统计调查的意义和种类,3,(三)统计调查的要求: 准确性(真实性、客观性)如实反映客观实际。真实性是统计的生命。 及时性在规定时间内尽快提供统计资料。过时的信息有如“雨后送伞”。 全面、

2、系统调查方案规定调查的单位要全、项目要全,不能遗漏。资料残缺不全,就不能正确、系统地反映现象总体的实质和规律性。,4,(一)按调查对象包括的范围 全面调查:构成总体的所有单位的调查 非全面调查:构成总体的一部分单位的调查,二、统计调查的种类,全面调查与非全面调查不是以最后获得的不是全面资料来衡量。而是以调查对象所包括的单位的多少划分的。,5,(二)按统计调查的组织形式 统计报表:按照国家统一规定的表式和要求,自上而下的统一布置,自下而上的提供统计资料的一种定期的调查方法。 专门调查:为研究某些专门问题而由调查单位组织的多属一次性调查。,经常性调查:随着现象的不断变化而连续不断地进行登记,(三)

3、按调查登记的时间是否连续,一次性调查:间隔一段时间对调查对象进行登记,6,三、统计数据搜集的方式 方式一:直接搜集 直接向调查对象搜集反映调查单位的统计资料(原始资料或初始资料)。亦称为统计调查 方式二:间接搜集 根据研究的目的,搜集已经加工、整理过的、 说明总体现象的资料(次级资料或第二手 资料)。,7,四、统计调查与一般社会调查 的主要区别 1、主要着眼于数字资料的搜集 2、不是搜集个别单位的资料,而是搜集大量单位的资料并能够据以汇总计算形成说明总体的综合数据。,8,一、确定统计调查的目的(Why)二、确定调查对象和调查单位(Who)三、确定调查项目(what)四、确定调查时间和调查期限(

4、hen)五、确定调查的组织实施计划六、选择统计调查方法, 第二节 统计调查方案设计,9,一、确定统计调查的目的(Why),调查任务和目的是统计调查的依据,要确定为什么要调查,调查要解决什么问题。如果任务不清、目的不明,就无法确定向谁调查、调查什么,以及用什么方法进行调查。调查任务和目的是根据一定时期内对某一具体统计调查对象进行调查的具体要求和实际需要来决定的。例见P21人口普查的目的。,10,调查对象:需要进行研究的总体范围,即调查总体调查单位:是组成调查对象的个体单位,是调查项目 或标志的承担者。调查对象和调查单位是总体和总体单位在统计调查阶段的具体表现。填报单位(报告单位):负责上报统计调

5、查资料的单位。 调查单位与填报单位有时一致 有时不一致,二、确定调查对象和调查单位(Who),11,(一)调查项目:是指调查中所要登记的调查单位的数据及其他有关情况。确定调查项目的依据是事先设计好的统计指标。 确定调查项目时应注意数据搜集的可比性、项目和指标解释的一致性(保证项目和指标之间的衔接性和一致性)。(二)调查表:将确定的调查项目和调查指标按照一定顺序排列在规范的表格上就形成了统计表。,三、确定调查项目(what),12,调查表组成:表头、表体和表脚三部分。调查表形式:单一表和一览表两种。一览表:把多项调查单位和调查项目按次序登记在一张表格里的统计表称为一览表。单一表:一张调查表里只登

6、记一个调查单位的多个调查项目的统计表称为单一表。如果调查项目较多,可以分列几张表格填列。,13,烟台大学本科生教学记录表(一览表)课号课序号:072000091 课程名:统计学 学分:3 页码:1,表头为每一个调查单位都具有的项目,只需填写一次。,一览表:把多项调查单位和调查项目按次序登记在一张表格里的统计表称为一览表。 如考试成绩登记表、教学记录登记表等。,14,2005年度注册会计师全国统一考试准 考 证(单一表),姓名区位码,注意:1. 考生凭准考证、身份证入场参考; 2. 务必使用2B铅笔在”答题卡”上按要求填涂准考证号、姓名区位码及答案,错误填涂,责任自负。,财政部注册会计师考试委员

7、会办公室签发日期:2005年08月19日,单一表:一张调查表里只登记一个调查单位的多个调查项目的统计表称为单一表。如果调查项目较多,可以分列几张表格填列。 如学籍登记卡、固定资产卡片、注册会计师报名登记表等。,15,(三)确定调查项目应注意的问题P22,、调查项目少而精;、本着需要和可能的原则,选择能得到准确 答案的项目;、重要项目从多层面进行调查,以便调查数 据能够相互印证;、对于“封闭式问题”尽可能采用“选择式” 答案形式,以便于统计分析。,16,1、调查时间:调查资料所属的时间。调查时间有两种含义:如果所要调查的是时期现象,就要明确规定 搜集数据的起止时间;如果所要调查的是时点现象,就要

8、明确规定 统一的标准时点。2、调查期限:是指调查工作开始和结束的具 体时间要求。,四、确定调查时间和调查期限(When),17,调查机构的组建、人员的组织; 调查方法、调查步骤的确定; 人员的组织培训; 调查资料报送方式; 调查经费的预算与筹集; 调查工作进度与时间安排; 统计调查的宣传教育、文件印制等工作。,五、制定调查的组织实施计划,18,可归纳为:询问调查和观察实验两大类。(一)询问调查1.访问调查(入户调查或派员调查):是指专门派出调查人员,前往调查对象所在地,直接进行面对面的信息交流和当场登记的一种调查方法。2.座谈会调查:调查对象一般为有针对性的特征人群,如某行业或领域的专业人士、

9、专家学者或某类消费群体等,所进行的调查。,六、选择统计调查方法,19,采访法,20,3.电话调查:通过电话进行信息交流和数据登记的一种调查方法。时效快,费用低。,调查者,被调查者,平等合作,21,4.邮寄调查:通过邮政系统采集信息的方法.,22,4.计算机辅助调查:利用现代信息网络收集资料的方法,具有时效快,费用低的特点。,23,(二)观察和实验调查1.观察法:调查者到现场单方面观察、采集信息的一种数据搜集方法。2.实验法:在特定的试验环境下,对调查对象进行实验测量,采集所需数据的方法。,24,七、调查问卷设计,问卷设计是统计调查的重要工具。科学的问卷设计技术是提高调查数据搜集效率和保证数据质

10、量的重要环节。(一)调查问卷的结构由开始、主体和结束三个部分组成。1、问卷的开始部分主要包括识别信息、问候语和填写说明构成,25,您认为吸烟有哪些害处?,容易滋生腐败,您认为吸烟有哪些害处?危害自身健康影响他人健康浪费钱财容易引起火灾破坏家庭团结,封闭式问题,开放式问题,容易控制,但不易全面,不易控制,但内容丰富,您认为吸烟有哪些害处?危害自身健康影响他人健康浪费钱财容易引起火灾破坏家庭团结其他,26,2、问卷的主体部分,是问卷的核心内容,包括所有封闭性问题及其答案,以及开放性问题。,b.封闭型提问 要求被调查者在确定的可供选择的回答类型中,任意选择一种或几种答案进行回答。 a.开放型提问 答

11、案类型不做具体明确的规定,而由被调查者根据自己的想法用文字进行回答。,27,1)封闭性问题及备选答案的设计要求封闭性问题的表达要准确,内容要完整一般可以按照6W原则来检查:即按照who(谁),where(何处),when(何时),why(为什么),what(是什么),how(如何)这6个方面来设计。,28,封闭性问题的备选要不重不漏,针对所提出的问题,备选答案要覆盖所有可能出现的状态,并且各备选答案之间不能存在任何的遗漏、交叉和重叠,即保证封闭性问题备选答案的完备性和周延性。例如,对某一事件的态度,备选答案不能仅仅为“赞成”和“反对”,还应视具体问题设置第三项,诸如“其他”、“说不定”,“弃权

12、”等选项,共被调查者选择。,29,封闭性问题必须使用中性语言和陈述句式,问卷里的问题不应包含任何情绪和倾向,不能使用任何具有感情色彩和价值判断的表述,尽可能少使用否定句、反问句和感叹句等可能引发某种暗示和诱导效应的封闭性问题构造方式。例如您反对这项规定吗?是 否 其他您认为该饮料太甜了吗?太甜 适中 不够甜,30,封闭性问题的表述要简洁、通俗,为了提高问卷的回答率和数据的准确率,封闭性问题的表述要简洁,真正做到一目了然。同时封闭性问题的表述要通俗易懂,尽量避免专业词汇,提高问卷的适用性。,31,对敏感性问题的处理,敏感性问题:是指一些涉及个人隐私方面的问题,有关违法违约,违反社会道德规范,影响

13、个人利益和人际关系等方面的问题。例如,家庭存款多少、考试作弊行为、偷逃税款行为、个人婚姻状况、吸毒嫖娼问题、对领导和同事的个人评估等等。在一般问卷调查中应该避免任何的敏感性问题,以免造成被调查者的反感或顾虑,影响整个问卷的调查质量。,32,您是否吸烟(如果选,则跳过 题)吸烟不吸您每天大约吸多少支烟5支以下5-10支 10-15支 15-20 20-25支 25支以上您的吸烟历史大约有多长 1年以下1-5年5-10年10年以上您是否认为吸烟有害健康(请写出理由),调查单位中吸烟人所占比例,吸烟人群日吸烟数量情况,吸烟人群吸烟历史情况,调查对象对吸烟的看法,例:,33,封闭性提问的答案类型:定类

14、类型:可以出现两种形式:一种是两项式,即只有两种答案的回答方式例如:你今年打算购买电冰箱吗? 是( ) 否( )该类型适用于对互斥问题的选择,性别,34,通过选择可以了解用户最为关心的性能是什么,以此作为设计和改革产品的依据。,另一种是多项式,即列出多种答案由被调查者任意选择。 例如:请问你选购空调时,您更看重的性能是(请在选择的项目后划勾,可以选两项) 冷气强( ) 省电( ) 使用方便( ) 经久耐用( ) 价格的( ) 冷暖两用( ),适用于几种互不排斥的问题选择,35,定序类型:有关产品质量问题,提问往往由极好向极坏方向加以量度。例:你对家电市场供应状况感受是A.满意 B.比较满意 C

15、.无所谓D.不满意 E.很不满意 F.不知道,36,定序问题有时也可用连续的数字作为替换形式。(又称“温度计”型)例、你认为某产品的生命周期中处于何种阶段?在你认为的刻度上划圈。新产品诞生 产品被淘汰,0,1,2,3,4,5,6,7,8,37,定距类型: 实践中,对于连续变量,如收入、年龄等。( 因其不可能全部包含于封闭型提问中,可以考虑设置若干间距,重点考察有关变量大致处于怎样水平。),38,您是否吸烟(如果选,则跳过 题)吸烟不吸您每天大约吸多少支烟5支以下5-10支 10-15支 15-20 20-25支 25支以上您的吸烟历史大约有多长 1年以下1-5年5-10年10年以上您是否认为吸

16、烟有害健康(请写出理由),调查单位中吸烟人所占比例,吸烟人群日吸烟数量情况,吸烟人群吸烟历史情况,调查对象对吸烟的看法,例:,39,问卷设计的基本原则:先封闭后开放:问题的表达要清楚问题规范化、标准化(一句话问一件事;提问不能带有暗示;问题间的承接要清楚)先易后难.问题不超过访问者的能力,调查的内容应易于为被调查者所记忆,40,?,答题时间:一般控制在20分钟之内,过多的问题、过于难的问题将吓跑被调查者。,适当控制回答时间:问题顺序要先简后繁,核心问题应放在调查表的前半部分。,问卷设计的基本原则:,41,你曾经有过偷漏税行为吗?,你身份证末位数是单数吗?,特殊问题特别设计:充分估计到人们日常生

17、活中培养起来的心理防范机制的作用。,42,2)开放性问题的设计要求,开放性问题属于非标准化问题,被调查者不能简单地采用选择问题的方式完成问卷调查,而是需要自行组织语言来回答,这样就增加了调查的难度。因此在问卷调查中开放性问题应该处于配角的地位,作为封闭性问题的补充。通常开放性问题应放在整个问卷主体部分的末尾。,43,3、问卷的结束部分,一般由被调查者的背景数据构成。主要包括被调查者的姓名、性别、年龄、受教育水平、职业类别、居住地区等,以便按照研究目的进行分类比较分析。被调查者的背景数据放在问卷的结束部分提出,是一种消除被调查者顾虑的设计技巧,以避免被调查者在没有对问卷全面了解的情况下,就从自我

18、保护的潜意识出发,排斥问卷调查,拒绝回答或提供虚假答案。,44,第三节 统计调查的组织形式,45,一、普查(一)普查的概念和特点概念:是专门组织的一次性的全面调查。 如:人口普查,工业普查、经济普查等特点: 1.普查是一次性调查 2.普查是专门组织的全面调查 3.普查的工作量大,46,1、自上而下式:由专门的普查机构和人员对调查单位直接进行登记。2、自下而上式:调查单位根据原始资料或核算资料以统计报表的形式自行填报。3、快速普查适用于调查范围小、调查项目少的对象。,(二)普查的方式方法,47,、统一规定调查资料所属的标准时点;、正确选择普查时期;、尽可能同时开展调查,以便方法上和步骤的一致;、

19、调查项目一经确定,不能随意改变或增减。,(三) 普查的组织原则(P31),48,特点:,1.统一性2.时效性3.准确性,二、统计报表,概念: 统计报表是按照国家统一规定的表格形式、统一规定的指标内容,统一规定的报送程序和报送时间,自上而下的布置和自下而上的由调查单位逐级提供统计资料的一种定期取得统计资料的一种调查方式。,49,第六次人口普查,人口普查的目的是全面掌握全国人口的基本情况,为研究制定人口政策和经济社会发展规划提供依据,为社会公众提供人口统计信息服务。,50,优点:,1.精心周密设计、高度统一、规范。2.回收率高,内容相对稳定,便于资料积累、 对比。3.层层上报、逐级汇总,可以满足各

20、部门需要,51,调查者,被调查者,强制、约束,报告式统计报表制度 (逐级上报),52,种类:.按实施范围:国家、部门、地方统计报表.按调查范围:全面统计报表和非全面统计报表.按报送周期:定期报表和年报.按填报单位:基层报表和综合报表.按报送方式:电讯报表和书面报表,53,三、重点调查概念: 在调查对象中选择一部分重点单位进行调查的一种非全面调查。重点单位的选择: 重点单位是它们的标志总量在总体总量中占据绝大比重。其特征可以反映总体的基本情况,54,2、重点单位的选择原则 1)数量比重尽可能地小 2)标志值比重尽可能地大重点调查的组织形式: 一种是专门组织的一次性调查 另一种是利用定期统计报表经

21、常性地对一些重点单位调查。,55,四、典型调查 1、概念 典型调查是一种非全面调查,它是根据调查的目的与要求,在对被调查对象进行全面了解的基础上,有意识地选择若干具有典型意义的或有代表性的单位进行的调查。 2、特点 a.深入细致 b.探索事物发展变化规律,56,3、作用: 补充全面调查和其它非全面调查的不足; 研究新生事物,促进其发展; 一定条件下,对总体进行描述。 4、典型单位的选择: 中等典型、先进典型、落后典型 5、典型调查的具体方法: 1)专门组织的一次性调查,采用座谈会或深入访谈的方法搜集调查数据; 2)根据需要也可以采用调查表的方式。,57,五、抽样调查 1、概念 抽样调查是一种非

22、全面调查,它是按照随机原则从总体中抽取一部分单位作为样本进行观察研究其目的是以抽样样本的指标去推算总体指标的一种调查方法。,2、特点: 1.遵循随机原则 2.根据样本的数量性推断总体的数量特征 .抽样调查的误差可以事先计算并加以控制,58,作用:1、可以了解全面调查无法或很难承担的调查任务2、虽然可能取得全面资料,但不必进行全面调查的情况。3、对全面调查结果进行检验和修正。 4、对于要求资料及时性很强的事物,如产品的验收检查、等其他应急的社会问题的调查等,也只有采用这种抽样调查方法才能满足需要。,59,三种非全面调查方法的主要区别,60,六、统计调查方法体系,统计调查必须多种方法结合运用,形成

23、体系我国统计调查体系的基本模式: 建立以必要的周期性普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和少量全面报表的综合性统计调查方法体系。,61,报 表 制 度,普 查,重 点 调 查,典 型 调 查,抽 样 调 查,制度化的调查,专门组织的调查,非全面调查,统计调查的组织形式图示:,全面调查,62,七、统计调查误差,(一)统计调查误差及其种类 统计调查误差是指统计调查结果所得到的统计资料与现实总体实际资料之间的差异。 种类: 1、登记性误差(调查性误差) 是由于调查过程中各个环节上的工作不准确而带来的。 调查过程中由于调查者和被调查者的人为因素,63,调查者的人为因素主要有

24、:调查总体界定错误、调查单位缺失、计量和测量误差、记录失误、抄录错误、汇总差错等等。被调查者的人为因素主要有:不配合调查、有意识或无意识地提供虚假数据等等。全面调查和非全面调查都可能产生登记性误差,全面调查产生登记误差的比率更高。从理论上来说,登记性误差是可以消除的。,64,2、 代表性误差 (只在非全面调查中有的。用部分推算总体产生的误差。) 其产生的原因主要有: 1)抽取样本是没有遵循随机性原则; 2)样本结构与总体结构存在差异; 3)样本容量不足等。 代表性误差通常无法消除的,但事先可以进行控制或计算。,65,1、登记性误差的控制:提高调查员人的业务素质和职业道德,强化敬业意识,提高业务

25、技术水平,培养认真、细致的执业品质.2、代表性误差的控制 :一定要遵循随机原则,样本容量要适当,宁大勿小,提高抽样推断的把握程度。,(二)统计调查误差的控制,66,例如:某生产车间20名工人日加工零件数资料如下:117 108 110 117 110 117 130 114 110 114 128 120 110 124108 117 124 114 120 117,67,第四节 统计分组,一、统计资料整理的意义及作用 统计整理是统计工作的第三阶段。它是根据统计研究的任务,对统计调查阶段所搜集到的大量原始资料进行加工汇总,使其系统化、条理化、科学化,以得出反映事物总体综合特征的资料的过程。 包

26、括系统地积累资料与为研究特定问题对历史或次级资料进行的再加工。,68,作用: 1.实现统计资料从个体量的记录到总体量的描述的必经阶段。 2.是统计调查的继续,统计分析的前提,具有承前启后的作用。,69,二、统计资料整理的内容和步骤 分组、汇总和编表具体步骤如下:、设计和编制统计资料的汇总方案、对原始资料进行审核。(逻辑检查、技术检查)、用一定的组织形式和方法对原始资料进行分组、汇总和计算。,70,、对整理好的资料再一次进行审核,改正在汇总过程中所发生的各种差错。(第二次复查) 、编制统计表,以简明扼要地表达社会经济现象在数量方面的有关联系。 6、统计资料的保管与积累。,71,三、统计分组的概念

27、 统计分组就是根据统计研究的需要,将统计总体按照一定的标志区分为若干个不同类型或性质的部分的一种统计方法。,72,分组前,分组后,25,33,42,73,统计分组具有两方面含义:,“组内性质更近,组间差异更大”,对总体而言“分”,将总体分为性质相异的若干部分。,对总体单位而言“合”,将性质相同的总体单位组合起来。,分 组 结 果:,74,1.划分性质不同的各种类型,研究其特征和规律性,某地近几年农业总产值情况 单位:亿元,四、统计分组的作用p40-42,75,.分析总体中各个组成部份的构成情况,我国国内生产总值构成情况(%),76,可以揭示现象之间的依存关系,340,18 20,310,16

28、18,270,14 16,230,12 14,200,10 12,单位面积产量(kg),按耕作深度分组(厘米),单位面积产量与耕作程度的关系,77,五、分组标志的选择,(一)分组标志选择的原则.目的性原则:根据研究问题的目的选择 需要具有对所研究问题的系统专业知识.本质性原则:选择反映现象本质特征的 标志作为分组标志。 反映职工生活水平:总收入 ? 平均收入?,78,.具体条件原则:结合现象所处的具体历史条件或经济条件 如:历史上富足生活的“三大件”。,79,(二)统计分组的种类,按分组标志个数不同分为:简单分组与复合分组,简单分组,平行分组体系,简单分组又称单一分组,就是对研究对象总体只按一

29、个标志的分组进行分组。,对总体选择两个或两个以上的标志进行简单分组形成的分组体系,80,大学生总体研究的平行分组体系:按学历分组 本科 专科按性别分组 男 女按学科性质分组 文科 理科 工科,特点:每一分组只能固定一个因素对差异的影响,而不能固定其它因素对差异的影响。,81,对同一总体选择两个或两个以上标志进行重叠分组,就叫复合分组。多个复合分组组成的体系就是复合分组体系。,工业企业按经营组织形式和规模大小同时进行分组按经营组织形式分组: 按规模分组: 大型企业 内资企业 中型企业 小型企业 大型企业港澳台商投资经营企业 中型企业 小型企业 大型企业外商投资经营企业 中型企业 小型企业,82,

30、大学生总体研究的复合分组体系,特点:第一次分组只固定一个因素对差异的影响;第二次分组则同时固定两个因素对差异的影响;当最后一次分组时,则所有被选择标志对差异的影响全部被固定。(主要标志次要标志所有标志),83,2按分组标志性质分为品质标志分组和数量标志分组,品质标志分组,数量标志分组,84,(三)统计分组的方法,1.品质标志分组,某班学生的性别构成情况,85,117 108 110 117 110 117 130 114 110 114 128 120 110 124108 117 124 114 120 117,2.数量标志分组,例如,某生产车间20名工人日加工零件数资料如下:,86,某车间

31、20名工人日加工零件分组表,某车间20名工人日加工零件分组表,87,某车间20名工人日加工零件分组表,88,第五节 分配数列,一、分配数列的概念二、分配数列的种类三、变量数列的编制,89,在统计分组的基础上,将总体中所有单位按组归类整理,形成总体中各单位数在各组间的分配称为频数分布又称次数分布。,将各组组别与各组次数依次排列而形成的数列叫次数分布数列,简称分配数列。,一、分配数列的概念,90,某班学生的性别构成情况,构成要素:)分组标志下的具体表现或分组形成的各组 )各组相对应的总体单位数,91,某企业工人平均日产量,各组组别,次数,比率或频率,92,某车间20名工人日加工零件分组表,次数及其

32、分布,分组(变量),93,按品质标志分组形成的数列,属性分配数列(品质数列),分配数列,二、分配数列的种类,单项式分配数列,组距式分配数列,等距分组,异距分组,变量分配数列(变量数列),总体按单项式分组而形成的变量数列。即每一个变量值就是一个组,顺序排列。,各变量值按一定组距进行分组而形成的数列。即每个组是一个由若干变量值形成的区间表示,按数量标志分组形成的数列,94,三、变量数列的编制,(一)单项式变量数列的编制单项式变量数列:总体按单项式分组而形成的变量数列。编制时每一个变量值是一个组,顺序排列。(在组数不多和组数变动幅度不大时采用),95,(二)组距式变量数列的编制 组距式变量数列:各变

33、量值按一定组距进行分组而形成的数列。每个组是一个由若干变量值形成的区间表示。(在变量个数较多、变动幅度较大时采用。),96,等距分组和异距分组,按组距是否相等可将组距数列分为:1、等距数列:是指各组组距都相等的组距数列。适用范围:适用于变量值变动比较均匀的现象,即各组间性质差异是由变量值均匀增加或减少而引起的。例如,成绩、身高、体重、计划完成程度等。,97,等距数列可绘制次数分布直方图和次数分布折线图.直方图的面积与折线图所围成的面积相等。折线两端应在直方图的左右两边各延伸一个假想组,并连接至假想组的中点。根据分组表绘制次数分布直方图次数分布折线图,98,某班学生统计学考试成绩表,99,100

34、,101,2、异距数列:指各组组距不完全相等的组距数列。 1)适用范围:当总体的分布存在明显的偏斜状况时,变量不适合等距分组;总体单位的变量变动范围较大,若变量按一定比例关系发展变化的话可按等比间隔分组编制异距数列(P52)。例如,炼钢高炉按容积(m3)的异距分组为:,102,钢炉容积(m3) 组 距 100以下 100200 100 200400 200 400800 400 8001600 800 1600以上 组距间隔等比为2,103,某车间20名工人日加工零件分组表,下限,上限,组距,组距式分组,连续式分组,104,某车间20名工人日加工零件分组表,组距式分组,间断式分组,105,某车

35、间20名工人日加工零件分组表,下开口组,上开口组,组距式分组,开口组,106,异距数列各组次数的数值受组距不同的影响。组距大次数数值可能大,组距小则次数数值可能小。,某车间20名工人日加工零件分组表,异距分组,107,在异距数列中,由于各组组距不完全相同,因此分布在各组中的次数就不具有可比性。,为消除组距不同的影响需要将不等组距的次数换算为标准组距次数。,标准组距的确定:选择数列中最小的组距。,108,次数密度即为单位组距内分布的次数。其作用等于将组距改为相等后,次数也作相应的调整。用调整后的次数密度来观察异距数列的实际分布。,109,通过标准组距次数或次数密度将异距数列中不可比的各组次数换算

36、成可比的各组次数,并可根据标准组距次数或次数密度来绘制次数分布直方图和次数分布折线图,用以反映总体的数量分布特征。,频率密度:单位组距内分布的频率公式:,110,某厂工人年龄分布情况表,标准组距为组距最小值5,111,年龄,人数,未经处理的异距数列直方图,112,次数密度,某厂工人年龄次数分布直方图,异距数列,标准组距人数,年龄,113,标准组距人数,异距数列,A,B,C,D,某厂工人年龄次数分布折线图,次数密度,年龄,114,某地工业企业总产值计划完成情况,115,次数分布,116,次数密度分布,117,问题: 如果要对烟台地区的家庭按其拥有的儿童数进行分组,请问应编制单项式变量数列,还是编

37、制组距式变量数列?为什么? 如果对烟台地区的所有工业企业按产值进行分组,又应编制什么样的变量数列?,118,组距数列的编制第一步:使原始数据序列化,计算全距第二步:确定组数和组距第三步:确定组限第四步:计算组中值第五步:分组归类,形成变量数列,119,现有某车间50名工人日加工零件的资料如下: 117,108,110,112,137,122,131,118,134,114,124,125,123,127,120,129,117,126,123,128,139,122,133,119,124,107,133,134,113,115,117,126,127,120,139,130,122,123,

38、123,128,122,118,118,127,124,125,108,112,118,121,第一步:使原始数据序列化,计算全距,120,将上述资料排序得到表,计算全距max (x)min (x)139-107=32,121,1、组数的确定,组数即分组个数,需要考虑因素很多。基本原则是:)体现各组间质的不同)总体单位数的多少)全距的大小,第二步:确定组数和组距,122,美国学者斯特杰斯 (HAsturges) 创用的经验公式: 1+3.322lgN 当总体单位按某一标志分组接近正态分布时,可根据总体单位数确定组数。组数=1+3.322lgN,=1+3.322lg50=6.6447,123,2

39、、组距的确定组距即各组中最大值与最小值之差。用 i 表示。需考虑:)组内同质性)研究目的)数列分布的偏斜程度,124,在经验公式基础上推算 i 关系成立 i=R/K i一般取或10的整数倍。且满足,组数与组距的关系i大,则小,两者呈反比关系。,125,该公式只适用于计算连续组距式场合的组距大小,例如成绩分组中,60一70分,70一80分,其组距为10分(70一60或80一70)。,如果将这一公式套用于间断组距式,将会产生谬误。例如,商店规模按职工人数分组,分为;15人,610人,11一15人等。套用上述公式会得出组距为4人的结论,显然是错误的。,组距上限下限,组距是多大?,126,间断式分组的

40、组距计算,必须采用如下公式:,组距本组上限一前组上限 (1) (或)本组下限一前组下限 (2) (或)本组上限一本组下限十1 (3),127,全距最大值-最小值,=139-107=32(件),组数=1+3.322lgN,=1+3.322lg50=6.6447,一般来讲,组距取5或10的倍数,于是就有组距为5的结果。,=5,128,第三步:确定组限组限即组距两端的分界限,界限的合理确定至少要考虑以下因素:)根据变量的性质确定,A、重叠组限: (适用于连续变量) “上组限不在内原则”(变量值越大越好),B、不重叠组限(适用于离散变量),129,)根据极端值的存在与否确定首末组是否采用开口组还是闭口

41、组A、闭口组:(数据分布较为集中,不存在极端变量值)B、开口组:(数据分布较为集中,且存在极端变量值),130,开口组假定组限公式:首组假定下限首组上限邻组组距末组假定上限末组下限邻组组距西瓜分组: kg以下; kg 6kg以上首组的假定下限 末组的假定上限=10kg,131,)根据能否反映数据的真实分布特征确定满足:“首组的下限(初始值) 数列中的最小值”“末组的上限 数列中的最大值”,132,组中值是上、下限之间的中点位置。,第四步:计算组中值,组中值代表各组内的一般水平,有一定的代表性,即假定次数在组内分布是均匀的,133,某车间50名工人日加工零件分组表,第五步:分组归类,形成变量数列,134,小结:,1.组数的确定 K 要适中,不惟一,2.组距的确定 以5或10的倍数,3.组限的确定 组限的形式与变量有关 开口组的设置,135,例题,某班40位同学统计学的考试成绩如下: 99 94 82 77 79 97 78 95 92 93 84 79 65 98 67 59 72 84 85 87 88 76 99 74 60 82 60 89 86 89 81 77 73 65 66 83 63 79 70 56,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 实用文档 > 调研文书

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报