1、第四讲: 统计表和统计图,【统计学研究内容】,统计设计,统计描述,总体估计:即参数估计,包括点值估计和区间估计,假设检验: t-test u-test x2-test,数值变量,离散趋势,集中趋势,分类资料:率、构成比、相对比等,统计表和统计图,统计推断,二、统计图的作用、种类、适用范围 及绘图要点。,【教学内容】,一、统计表的作用、结构及列表原则,【教学要求】,统计表与统计图的作用,统计表的结构和种类,列表的原则和基本要求,统计图制图的基本要求。几种常用统计图适用条件、绘制要点。,统计图(statistical chart)用图形代替数据,获得直观、形象的效果,统计表(statistical
2、 table)数据代替文字描述,便于统计结果的精确、简洁的表达和对比分析,统计表和统计图,一、常用的统计表,1. 统计表的结构,表序 标题,题注:,2. 列表原则:,(1)重点突出,简单明了,使人看过后能明白表格所要表达的主要内容。 (2)主谓分明,层次清楚,避免层次过多或结构混乱。,表3.14 2001年某省不同地区的卫生系统反应性评分比较,表注:,3. 编制要求:,4. 统计表种类:,简单表(simple table): 由一组横标目和一组纵标目组成,复合表(combinative table): 由两组及以上的横标目和纵标目结合起来或一组横标目及以上纵标目结合起来以表达它们之间关系的统计
3、表,复合表举例:,表3.15 2001年某省不同地区、性别的卫生系统反应性评分比较,1. 标题:一般写在表格的上方,内容应包括时间、地点、主要事件,要求用最少的文字说清楚。 2. 标目: 横标目要按时间前后或数量大小和事情的重要性等顺序排列,纵标目有单位的要注明单位。注意标目的层次要清楚,不要太多、太复杂。 3. 线条:统计表中只有横线,无竖线和斜线。 4. 数字:一律用阿拉伯数字。同一列的小数位数应一致,且位次对齐。表格中不应有空格,暂无记录或未记录用“ ”(点号)表示,无数据用“”表示,这两种情况都不能填“0”。 5. 备注:不应写在表中,在数字上角用“*”号标出,文字叙述写在表的下方。,
4、列 表 要 求,改错题1:,改错题2:,二、常用的统计图,常用的统计图,条图 bar graph,直方图 Histogram,圆图 Pie chart,线图 Line graph,统计地图 Map,散点图 Scatter,百分条图 Percent bar,【举例】 有甲、乙、丙三个样本人群,每组各有100例,检测其血清乙型肝炎表面抗原的结果,各组阳性人数分别为7例、5例、3例,比较哪组乙肝患病严重? .,(一)条图(bar graph), 概念:用等宽长条的高度来表示按性质分类 资料各类别数值的大小及相互的对比关系。 适用条件:相互独立的资料。 分类:分为单式和复式两种。单式适用于只有一组观察
5、资料(见图1)复式适用于有若干组观察资料(见图3),1. 横轴为基线,表示各个类别(观察项目),纵轴表示为数值的大小。 . 2. 纵轴坐标一定要从0开始,中间不宜折断。 . 3. 各直条宽度应相等,各直条之间的间隙应相等或为其一半。 。 4. 排列顺序可根据数值从大到小,或按时间顺序排列。.,制图要求:,5.复式条图在同一观察项以组为单位,一个组包括两个以上的直条,直条所表示的类别应用图例说明,同一组的直条间不留空隙。,图3 2001年某省不同地区、性别的卫生系统反应性评分比较,【举例】 2001年某医科大学公共卫生学院人员组成,教授占9.8%、副教授33.2%、讲师21.4%、助教10.2%
6、 、教辅人员25.5%,比较人员的构成情况。,图3.4 2001年某医科大学公共卫生学院专业技术人员构成,(二)圆图(pie graph), 概念:以圆形总面积代表100%,把面积按比例分成若干部分,以角度大小来表示各部分所占的比重,即构成比例。 适用条件:百分构成比资料。 应用:描述各部分的百分构成。,制图要求: 1.绘制一大小合适的圆,每3.6o为1%,用3.6乘以百分数即为各构成部分所占扇形的度数,用量角器画出。 2.从相当于时钟12点或9点的位置开始顺时针方向绘图。 3.每部分用不同线条或颜色表示,注明简要文字及百分比或用图例。 4.当比较不同资料的百分构成时,可以画两个直径相同的两个
7、圆,使各圆中各部分的排列次序一致,并用相同的图例表示同一个构成部分。,【举例1】 2001年某医科大学公共卫生学院人员组成,教授占9.8%、副教授33.2%、讲师21.4%、助教10.2% 、教辅人员25.5%,比较人员的构成情况。,【举例2】 某地5岁以下儿童死因分布,呼吸系统疾病占43.5%、传染病30.8%、先天缺陷17.2%、其它8.5%,比较其构成情况。,(三)百分条图(percent bar), 概念:以直条总长度作100%,直条中各段表示事物各组成部分的构成情况,亦称构成条图。 适用条件:百分构成比资料。 应用:描述各部分的百分构成。,图3.4 2001年某医科大学公共卫生学院专
8、业技术人员构成,副教授,教辅人员,讲师,助教,教授,制图要求: 1. 标尺:一定要有标尺,画在图的上方或下方。全长为100%,分成10格,每格10%。 2.绘一直条,全长等同标尺,以直条内相对面积大小代表数量的百分比,一般由大到小、自左向右排列。 3.直条各部分用线分开,注明简要文字或加图例表示。 4.多组比较:若要比较的事物不止一个时,可以画几个平行的百分条图。各条图的排列顺序同,图例同。,【举例1】描述某地在1949年1958年婴儿死亡率变化 的趋势。,【举例2】描述某地2001年07岁儿童受教育的情况,并比较男女受教育情况的差异。,图3.6 2001年某地0 - 7岁儿童的受教育率,(四
9、)线图(line graph), 概念:以线段的上升或下降来表示资料的变化,并可表明一种事物随另一种事物(如时间)变迁的情况 。 适用条件:连续性资料。 应用:反映事物的连续的动态变化规律。,制图要求: 1.坐标轴:横轴表示某一连续变量(时间或年龄等),纵轴表示某种率或频数。其尺度必须等距,或有规律性。 2.图线应按实际数字绘制成折线,不能任意改为光滑曲线,无数据的组段用虚线连接,直线不能任意外延。 3.同一张线图上不要画太多条曲线,通常5条。 4.有几根线须用不同颜色或图线(虚、实线)区分,并附图例。,年龄(岁),受教育率(%),图3.6 2001年某地0-7岁儿童的受教育率,【举例1】描述
10、某市100名男童的身高频数的分布情况。,图8 某市100名8岁男童身高(cm)的频数分布,【举例2】描述某地2001年07岁儿童受教育的情况,并比较男女受教育情况的差异。,图3.6 2001年某地0-7岁儿童的受教育率, 概念:以不同的直方形面积代表数量,各直方表面积与各组的数量(频数)多少呈正比关系。 适用条件:连续性资料。 应用:用于表达连续性变量的频数分布。,(五)直方图(histogram),制图要求: 1.横轴表示连续变量,纵轴表示被观察现象的频数(或频率),以各直条(宽为等距)的面积表示各组段频数;纵轴坐标一般从0开始。 2.各直条间不留空隙。 3.组距不等时,横轴仍表示连续变量,
11、但纵轴是每个横轴单位的频数。,图3.6 2001年某地0-7岁儿童的受教育率,【举例】描述某年某地区饮水中氟含量与氟骨症患难率的相关关系。,y=6.3942x+18.784 R2=0.882,图3.8 某年某地区饮水中氟含量与氟骨症患难率的散点图,氟含量,氟骨症患病率 %,(六)散点图(scatter diagram), 概念:以直角坐标系中各点的密集程度和趋势来表示两种现象间的相关关系。 适用条件:双变量资料。 应用:反映两事物间的相关关系,主要用于相关回归分析。,制图要求: 1.一般横轴代表自变量或可进行精确测量、严格控制的变量,纵轴则代表与自变量有依存关系的因变量。 2.纵横轴的尺度起点
12、可根据需要设定。 3.组距不等时,横轴仍表示连续变量,但纵轴是每个横轴单位的频数。,图3.8 某年某地区饮水中氟含量与氟骨症患难率的散点图,y=6.3942x+18.784 R2=0.882,氟含量,氟骨症患病率 %,(七)统计地图(map),统计地图:用于表示某现象的数量在地域上的分布。,直条图与直方图纵坐标要求从0开始。如果不从0开始,容易造成错觉 。,绘制统计图的注意事项,统计图类型。例如:独立资料用直条图;连续资料用线图或直方图;构成比资料用百分条图或圆图;双变量资料用散点图;地区性资料用统计地图等。,合适的标题。标题写在图的下方,其要求和统计表的标题的要求一样,要能够概括图的内容,直
13、条图、线图、半对数线图和直方图的纵、横坐标上要有刻度和单位,刻度要均匀等距,纵横轴长度之比为57较合适,比例太大或太小都不合适。,比较不同事物时用不同的线条和颜色来表示,并附上图例。,常用的统计图,条图 bar graph,直方图 Histogram,圆图 Pie chart,线图 Line graph,统计地图 Map,散点图 Scatter,百分条图 Percent bar,小结:各种类型统计图的适用条件及意义,14题共用备选答案:A. 条图; B. 直方图; C. 百分条图或圆图; D. 普通线图; E. 半对数线图,1. 表示各相对独立指标的数值大小宜用 。 2. 表示某现象随另一现象
14、而变动的趋势宜用 。 3. 表示全体中各部分的比重宜用 。 4. 表示连续性变量资料的频数分布宜用 。,练习题:,某研究者将3种处理条件下某定量资料随时间推移的变化数据绘制成条图,请问该种处理是否合适?,答案:,某研究者欲了解舒张压与血清中胆固醇 含量的关系。数据如右表所示:,编号 舒张压 胆固醇( id ) ( y ) ( x )1 80 3072 75 2593 90 3414 70 2375 75 2546 105 4167 70 2678 85 3209 88 374 10 78 316,舒张压与血清中胆固醇含量属于双变量 资料,应选择散点图。,答案:,第一部分总结,整理资料 Sorting data统计设计 搜集资料 Statistical design collection of data分析资料analysis of data,基本概念:,【统计学研究内容】,统计设计,统计描述,总体估计:即参数估计,包括点值估计和区间估计,假设检验: t-test u-test x2-test,数值变量,离散趋势,集中趋势,分类资料:率、构成比、相对比等,统计表和统计图,统计推断,THANK YOU!,