1、1,南京财经大学统计学系,第一章 统计学及其基本概念,2,本章内容,一、 统计学简介二、 认识数据三、 基本概念四、 统计计算工具,3,统计学简介,统计的涵义:统计工作、统计资料、 统计学统计学的内容 :描述统计学 、推断统计学统计学的过去与现在:统计学中的各大著名学派、统计学的现代格局统计学在经济管理中的应用:案例1 案例2 案例3 案例4,案例:我该什么时候上网?,4,认识数据,四个数据集:中国主要宏观经济指标数据集、95世界各国基本情况数据集 公司人力资源部数据集 、企业流水线上的抽样数据集按测量的精度分:分类数据 顺序数据 数值型数据 按与时间的关系分 :时间序列数据 截面数据 面板数
2、据按数据表现形式分:绝对数 相对数 平均数变量按获取方式分:离散型变量 连续型变量变量按获取方式分:确定性变量 随机变量,5,基本概念,总体 、个体、样本、标志、指标、变量,6,统计计算工具,Excel:统计函数、统计分析工具马克威统计分析软件(方差分析、多元统计分析等)附:认证考试说明,7,统计工作,统计工作是为了管理或认识的需要,对社会经济现象和自然现象进行数量收集的活动。谁做? 统计局系统、 企业信息化,Statistical work,8,统计资料,统计资料是统计工作过程中所取得的各项数字资料以及与之相关信息的总称。统计资料是统计工作取得的能够说明所研究对象的数据。例如国内生产总值数据
3、,说明整个国家的生产规模。这些数据经常会在报纸、杂志上出现。,Statistical data,9,统计学,统计学是在统计工作的经验积累到一定程度时自然产生的,它是收集、整理、描述分析统计数据的方法和技术,为我们的决策提供“量”方面的依据。 不列颠百科全书对统计学的定义为:“统计学是关于收集和分析数据的科学和艺术”。,Statistics,10,中华人民共和国国家统计局,11,企业信息化模式,12,艺术:金字塔,13,描述统计学,描述统计学研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征。,Descript
4、ive Statistics,14,推断统计学,推断统计学是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征作出以概率形式表述的推断。,Inferential Statistics,15,统计描述法,统计描述法是对由调查或实验得到的统计数据资料进行整理、归类,计算出各种能反映总体数量特征的综合指标,并加以分析研究,从而得出需要的数据资料信息,用表格、图形和统计指标数值来表示的统计方法。,16,统计学中的各大著名学派,1. 国势学派 2. 政治算术学派 3. 数理统计学派 4. 社会统计学派,17,统计学的现代格局,一是以社会经济问题为主要
5、研究对象的社会经济统计,从属于应用经济学。 二是以方法和应用研究为主的数理统计。从学科的角度看,从属于数学。,18,国势学派,人物:【德国】康令和阿亨瓦尔贡献:提出世界公认的名词统计学(Statistics) 评价:“有统计之名,无统计之实”的学派,19,政治算术学派,人物:【英国】威廉配第和约翰格朗特贡献:开用数量方法研究社会经济现象之先河评价:“有统计之实,无统计之名”的学派,20,威廉配第,配第著作政治算术中,对当时的英国、荷兰、法国之间的财富进行数量上的计算和比较 。 马克思称配第是“政治经济学之父,在某种程度上也可以说是“统计学的创始人”,21,数理统计学派,人物:【比利时】人才济济
6、。如:凯特勒、戈赛特 、费希尔、内曼、卡尔 皮尔逊贡献: (1)完成统计学和概率论结合(2)建立了丰富的数理统计理论,22,凯特勒,比利时统计学家(1796-1874)著作社会物理学提出著名的“平均人”概念,认为:社会所有的人与“平均人”的差距越小,则社会矛盾就越缓和。被统计学界称为“国际统计会议之父”和“近代统计学之父”,其贡献是发现了大量现象的统计规律性和开创性地应用了许多统计方法,为数理统计学的发展奠定了基础。,23,卡尔皮尔逊,他设计的“直线相关系数”是最常用的相关系数,从其构思过程中,体会“对称美”;他构建的“ 检验”是最常用的检验方法,从其公式形式中,体会“简单美”。许多学者把卡尔
7、皮尔逊尊称为“统计学之父”。,24,社会统计学派,人物:【德国】克尼斯、恩格尔和梅尔观点: 统计学的研究对象是社会现象,目的在于明确社会现象的内在联系和相互之间的关系。 在研究过程中,要用全面调查,也可以适量的使用抽样调查。,25,案例,收集数据 整理数据 分析数据 展现结果 作出决策,早点起,在网上飞驰,互联网的用户人数及分布、信息流量分布、域名注册、用户通常在什么时间上网等信息都可以从电讯局或网络公司的业务记录中获得 。汇总每天某个时间点上,在线用户占注册用户的比例来反映用户通常上网的时间,26,案例1,1995年9月,美国斯坦福大学经济学教授刘遵义就通过实证比较,数量分析和模糊评价等方法
8、,预测出菲律宾、韩国、泰国、印尼和马来西亚有可能发生金融危机。,27,案例2,2005年3月16日上证平均指数中30支股票的市盈率是21.08。东方电子集团有限公司的市盈率是17.92。这时,市盈率方面的统计信息显示:与上证指数股票的平均收入相比,东方电子集团有限公司的股票价格较低。因此,投资顾问可以得出结论:东方电子集团有限公司的现行价格低估了。,28,案例3,假设一家会计师事务所想确定客户的资产负债表中所显示的应收账款的数量是否公正地体现了实际的应收账款的数量。通常,应收账款的账目数量很大,要审查和验证每个账户既费时又费钱。怎么办?抽样调查可以解决问题!,29,案例4,零售付账柜台使用电子
9、扫描仪收集数据,可供各种营销研究应用。 数据挖掘的典型:啤酒与纸尿裤,30,分类数据,分类数据是对事物进行分类的结果,数据的主要特征是采用文字、数字的代码和其他符号对事物进行简单的分类和分组。分类数据以定类尺度(nominal scale)来衡量。,categorical data,31,顺序数据,即等级数据,是对事物进行分类的结果,这些分类在语义上表现出明显的等级或顺序关系,例如,学生成绩可以分为优秀、良好、中等、及格和不及格。顺序数据以定序尺度(ordinal scale)来衡量。,rank data,32,数值型数据,数值型数据是使用自然或度量衡单位对事物进行测量的结果,其结果表现为具体
10、数值。数值型数据有两种衡量尺度:一是定距尺度(interval scale)二是定比尺度(ratio scale)区别:“零点”,metric data,33,时间序列数据,时间序列数据是在不同时间上收集到的数据,它所描述的是现象随时间而变化的情况。,time series data,34,截面数据,截面数据是在相同或近似相同的时间点上收集的数据,它所描述的是现象在某一时刻或某一时间段的变化情况。,cross-sectional data,35,面板数据,面板数据是对若干个单位在不同时间进行重复跟踪调查所形成的数据。,panel data,36,绝对数,绝对数是统计数据的基本表现形式,是其他指
11、标形式形成的基础。现象的总体规模和水平一般都以绝对数形式表现,一个地区的总人口、国内生产总值、货物周转量等都是绝对数。,absolute number,37,相对数,相对数是由两个相互联系的绝对数对比得到,反映事物的相对数量。常用的相对数包括:结构相对数、动态相对数、比较相对数、计划完成相对数。,relative number,38,平均数,平均数反映现象总体的一般水平。如职工的平均工资。,average,39,变量,变量(variable)总是可以用数值形式表现的,可变的数量标志和所有的统计指标都是变量。分类:离散型变量、连续型变量确定性变量、随机变量,40,离散型变量,离散型变量一般用“点
12、数”的方法取得,数值往往是整数,如职工人数、企业个数、设备台数等。,discrete variable,41,连续型变量,连续型变量用“测量”取得,测量的仪器越精密,变量值就会越精确,如人的身高、体重;产品的长度、重量等。,continuous variable,42,确定性变量,受确定性因素影响的变量称为确定性变量。这种影响变量值变化的因素是明显的,是可以解释的,是人为的或者受人控制的,其影响变量值的大小、方向都可以确定。,deterministic variable,43,随机变量,受随机性因素影响的变量称为随机变量,所谓随机因素,是指各种不确定的、偶然性的因素,这种因素对变量影响的大小和
13、方向都是不确定的,通常是微小的。,random variable,44,计算工具,计算器要求会用“统计功能”计算机要求会用“Excel”作分析1. 公式和函数2. 数据分析工具,45,总体,统计总体,简称总体(Population),就是统计所要研究的事物或现象的全体,即由客观存在的,具有某种共同特征的许多个别事物构成的整体。 总体的特点:大量性、同质性、差异性、相对性,46,个体,个体(Item Unit)是构成统计总体的个别事物,又称为总体单位。,47,样本,样本(Sample)是指从统计总体中抽取出来作为代表这一总体的、由部分个体组成的集合体。抽取原则:随机、非随机非随机抽样:任意抽样、
14、判断抽样、配额抽样,48,标志,统计标志,简称标志(characteristic),是指每个个体所共同具有的属性或特征,它是说明个体的属性或特征的具体名称。标志按其性质分为品质标志和数量标志。 标志按变异情况分为不变标志和可变标志。 可变的数量标志称为变量,其值称为变量值。,49,指标,统计指标,简称指标(indicator),是反映总体数量特征的,由各个个体的标志值汇总综合而成。任何一个统计指标都是经过了从个别到一般、从具体到抽象的过程,它体现总体特征,具有综合性。注意:口径 外延、维度分类:数量指标、质量指标总体指标、样本指标,指标体系,50,指标体系,一系列相互联系、相互制约的多个统计指
15、标就构成统计指标体系。举例1:工业企业统计指标体系 企业管理与信息处理指标子体系 举例2:宏观统计指标体系 国民经济核算体系,51,【例】根据大量资料统计结果,汽车的车祸有70%发生于中速行驶时,30%发生于高速行驶时,就此能否认为高速行驶比中速行驶更安全?,维度,52,它是反映客观事物的规模或水平的指标,它表现为汇总后直接得到的绝对数或总量,又称之为总量指标或绝对指标。数量指标是最基本的指标,它是计算其他指标的基础。数量指标包括标志总量和总体单位总量,如总产值、工资总额、人口总数、企业个数等。,数量指标,53,它是反映客观现象之间的相互联系、比例关系、发展速度、内部结构的指标,一般用相对数或平均数表示。如劳动生产率、成本利润率、人均国民收入等。质量指标是由两个数量指标对比求得的,它是由数量指标派生的。,质量指标,54,企业管理与信息处理指标子体系,工业企业经营管理指标 工业企业企业管理指标 信息获取与利用指标,工业企业财务管理指标 工业企业经济效益评价指标,55,国民经济核算体系,