收藏 分享(赏)

统计学34195.ppt

上传人:dzzj200808 文档编号:3317840 上传时间:2018-10-12 格式:PPT 页数:67 大小:11.39MB
下载 相关 举报
统计学34195.ppt_第1页
第1页 / 共67页
统计学34195.ppt_第2页
第2页 / 共67页
统计学34195.ppt_第3页
第3页 / 共67页
统计学34195.ppt_第4页
第4页 / 共67页
统计学34195.ppt_第5页
第5页 / 共67页
点击查看更多>>
资源描述

1、第三节 获得数据的实验方式,一 、实验方式的基本概念 (一) 获得数据的实验方式的概念及优越性 (二) 实验的原则 均衡分散性原则 整齐可比性原则 二 、常用的实验设计方式 (一) 完全随机实验 (二) 随机区组实验 (三) 拉丁方实验 (四) 正交实验,第四节 统计数据的整理,一 、统计数据整理的含义与步骤 二 、统计分组 三 、频数分布 四 、数据结构的基本特征,一 、统计数据整理的含义与步骤,(一) 统计数据整理的含义所谓统计数据整理 ,是指根据统计研究目的,对搜集到的数据进行科学的加工处理 ,使之条理化 、系统化 ,以便反映研究对象总体的数量特征 ,满足统计分析的需要 (二) 统计数据

2、整理的步骤统计数据预处理 统计分组和汇总 统计数据的显示,(1)数据的审核 发现数据中的错误 (2)数据的筛选 剔除不符合条件的数据 (3)数据排序 升序和降序,统计数据预处理,(1)数据的审核(原始数据), 审核的内容 完整性审核 数据是否有遗漏 调查项目或指标是否填写齐全 准确性审核 数据是否真实 计算是否正确,数据的审核(原始数据),审核的方法 逻辑检查 数据是否符合逻辑,内容是否合理,有无相互矛盾的现象 计算检查 各项数据在计算结果和计算方法上有无错误,数据的审核(二手数据),适用性审核 弄清数据的来源、口径及相关背景材料 确定其是否符合分析研究的需要 时效性审核 使用最新的统计数据

3、确认是否应该进一步加工整理,(2)数据的筛选,当错误数据无法纠正时,需要对数据进行筛选数据筛选即把某些不符合要求的数据剔除,(3)数据的排序,按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索 在某些场合,排序本身就是分析目的之一 排序可借助计算机完成,二、统计分组和汇总,(一) 统计分组的含义与性质,统计分组的含义,统计分组就是根据统计研究的目的和现象本身的特点 ,选择一定的标志(一个或多个),将研究现象总体划分为若干性质不同的组或不同的类别 。,统计分组的性质,() 统计分组兼有分与合的双重功能 ,是分与合的对立统一 () 统计分组必须遵循“穷尽原则”和“互斥原则” ()

4、 统计分组的目的是要在同质性的基础上研究总体的内在差异性 ( 4 )任何一个统计分组都有一定的局限性 () 统计分组的关键是分组标志的选择和分组界限的确定,(二) 统计分组的种类,统计分组按照分组标志的多少 ,分为简单分组与复合分组 统计分组按分组标志的性质不同 ,分为品质分组和数量分组,三 、频数分布,(一) 频数分布的概念与种类,在统计分组的基础上 ,将总体中的所有个体按组归类排列 ,并计算出各组的汇总数 ,就形成频数分布 ,或称为频数分布数列,频数分布按分组标志的性质不同可以分为两种 ,即按品质标志分组的品质分布数列和按数量标志分组的变量分布数列 ,后者简称变量数列 。,品质标志的整理

5、(基本过程),1. 列出各类别,3. 制作频数分布表 4. 用图形显示数据,品质标志的整理 (可计算的指标),频 数(frequency):落在各类别中的数据个数,也称次数 2. 比 例(proportion):将对比的基数作为100 计算的比值,也称频率(percentage),品质标志整理频数分布表 (实例),【例】为研究广告市场的状况,一家广告公司在某城市随机抽取200人就广告问题做了问卷调查,其中的一个问题是“您比较关心下列哪一类广告?”1商品广告;2服务广告;3金融广告;4房地产广告;5招生招聘广告;6其他广告。,(二) 变量数列的编制,变量数列根据各组变量值的表现形式不同 ,又分为

6、单项数列和组距数列两种 。,变量数列的概念:将总体按照某一数量标志分组所形成的数列称为变量数列,也称频数分布(Frequency distribution),变量数列的概念及举例,编制变量数列(频数分布表)的步骤,编制变量数列的步骤,分组方法(Grouping methods),分组方法,单项数列,1. 将一个变量值作为一组 2. 适合于离散变量 3. 用于变量值较少、分布区间较小的情况,单变量值分组表 (实例),组距分组(实例),108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 11

7、2 134 127 123 119 113 120 123 127 135114 120 128 124 115 139 128 124 121 117 122 124 129 139 107 117 130 122 125,【例】某车间50名工人日加工零件数如下。试采用单变量值对数据进行分组,单项分组表 (实例),组距分组 (要点),将变量值的一个区间作为一组 适合于变量值较多的情况 必须遵循“不重不漏”的原则 可采用等距分组,也可采用不等距分组,组距分组 (步骤),1、确定组数和组距:组数的确定应能够显示数据的分布特征和规律。组数应根据数据的多少、分布区间、自身规律而定,一般59组比较合适

8、。,组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距( 最大值 - 最小值) 组数,确定组限,在组距数列中 ,必须划定各组的数量界限即组限,(1)最小组的下限应略低于总体的最小变量值 ,最大组的上限应略高于总体的最大变量值 ,使之成为整数构成的区间 (2)连续型变量的各组组限必须重叠 ,以防分组时出现遗漏某些个体的现象 (3)有时最小组只有上限而没有下限 ,最大组只有下限而没有上限 ,称为开口组 ,表示为“ 以下”或“ 以上” (4)组中值的计算,根据分组整理成频数分布表,组距分组 (几个概念),1. 下 限(low limit)

9、:一个组的最小值 2. 上 限(upper limit):一个组的最大值 3. 组 距(class width):上限与下限之差 4. 组中值(class midpoint):下限与上限之间的中点值,(组中值即该组平均值),等距分组表 (上下组限重叠),等距分组表 (上下组限间断),等距分组表 (使用开口组),等距分组表举例 累计频数(Cumulative frequencies),【例】某班级30名学生英语成绩如下,试采用组距数列进行统计分组。 90 75 60 52 48 78 92 63 80 79 65 42 70 35 95 58 78 71 82 68 50 78 81 72 95

10、,注意 (1)原则:上限不在本组内(2)符合现象本身的规律性,异距分组举例,四 、数据结构的基本特征,(一) 频数与频率,(二) 累计频数与累计频率,第五节 统计数据的显示,一 、统计表 二 、统计图,一、 统计表 (Statistical table),一. 统计表的概念和结构,统计表是统计数据显示的一种重要形式 。 经过汇总整理的统计数据 ,按一定的顺序排列在相应的表格内 ,就形成统计表 。,统计表的结构,行标题,表头,列标题,数字资料,注释,(二) 统计表的种类,按用途分类广义的统计表可分为调查表 、整理汇总表和分析表 。,按标志设计分类统计表按照是否分组以及分组标志多少 ,可以分为未分

11、组表 、简单分组表和复合分组表三种 。,复合分组表是指按两个或两个以上标志分组的统计表 ,可以利用多个标志结合起来对总体进行分组 ,以便进行更深入细致的分析研究 。,某地区各类企业产值分组表,按宾词设计分类,(1)简单排列 (2)分组平行排列 (3)分组层叠排列三种,简单排列是指宾词不作任何分组 ,按一定顺序排列在统计表中,十五”时期我国货物出口额,分组平行排列是将宾词中的不同标志各自分开作平行排列 ,不互相重叠,1990 2005 年我国就业人员分组表 单位 :万人,分组层叠排列是宾词的各个指标按复合分组形成的多层次重叠设置,“十五”时期我国进出口分组表 单位 :亿美元,要合理安排统计表的结

12、构 总标题内容应满足3W要求 计量单位:计量单位相同时,可放在表的右上角,不同时应放在指标名称后,也可单列出一列 通常情况下,统计表的左右两边不封口 表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一 对于没有数字的表格单元,一般用“”表示 必要时可在表的下方加上注释,(三)统计表的设计,二、统计图,(一) 品质数据的统计图 条形图,2、圆形图 (Pie chart ),3、环形图 (由 Excel 绘制的环形图),(二) 数值型数据的统计图 1、直方图(Histogram),频 数 (人),15,12,9,6,3,日加工零件数(个),某车间工人日加工零件数的直方图,我一

13、眼就看出来了,大多数人的日加工零件数在120125之间!,15,12,9,6,3,105,110,115,120,125,301,135,140,日加工零件数(个),频 数 (人),2、折线图,某车间工人日加工零件数的折线图,树茎,树叶,788,022347778889,0012222333344466777889,0133445799,数据个数,3、茎叶图 (Stem-and-leaf display),某车间工人日加工零件数的茎叶图,扩展的茎叶图,、箱线图 (Boxplot),箱线图实例,分布的形状与箱线图,不同分布的箱线图,【例】 从某大学经济管理专业随机抽取11人,对8门主要课程的考试

14、成绩进行调查,所得结果如表。试绘制各科考试成绩的比较箱线图,并分析各科考试成绩的分布特征,8门课程考试成绩的箱线图,11名学生8门课程考试成绩的箱线图,Min-Max,25%-75%,Median value,45,55,65,75,85,95,105,学生1,学生2,学生3,学生4,学生5,学生6,学生7,学生8,学生9,学生10,学生11,5、线图 (实例),【例】已知19911998年我国城乡居民家庭的人均收入数据如表所示。试绘制线图,¥,6、雷达图 (Radar chart),【例】1997年我国城乡居民家庭平均每人各项生活消费支出数据如表所示。试绘制雷达图。,今天的主食是面包,多变量数据雷达图 (实例),【例】为研究某条河流的污染程度,环保局分别在上游、中游和下游设立取样点,每个取样点化验水中的五项污染指标,所得数据如表。将各指标用雷达图表示出来,并分析该河流的主要污染源。,多变量数据雷达图,#数据类型及图示 (小结),

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 大学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报