1、2018/10/18,统 计 学 Statistics,主讲人:李庆东 经 济 管 理 学 院,2018/10/18,国家教育部把统计学 列为经济类、管理类大学本科学生的专业(核心)基础课。,统计 很重要哦!,导 论,2018/10/18,思考,为什么要学统计? 统计能够做些什么?,2018/10/18,“没有统计,其它科学可以存在,但是很渺小” “统计即生活,统计即人生” “统计是20世纪人类最伟大的发现之一” “统计就和柴、米、油、盐、酱、醋、茶一样,存在的时候并不是很突出,一旦不见了,人生就是黑白的了。” 联合国建议,一个能立足于现代国际社会的政府,必须有能力提供1600项国情统计数据。
2、,为什么要学统计?,2018/10/18,我们生活在信息时代,信息的主体就是统计数据。 所以,不仅从事统计和经济研究、管理的人必须懂得如何运用统计数据,从事各行各业的人都应该有一点统计知识,能正确运用和读懂统计数据。,2018/10/18,假如一个人的寿命为60岁那么他总共有21900天,一生时间的用途分别为:睡觉20年(7300天);吃饭6年(2190天):穿衣和梳洗5年(1825天);上下班和旅行5年(1825天);娱乐8年(2920天);生病3年(1095天);等待3年(1095天);打电话1年(365天);照镜子7天;擤鼻涕10天:最后只剩下3205天即8年零285天用来做有用的事。,
3、2018/10/18,世界人口平均预期寿命2000年为66岁,发达国家和地区为76岁,发展中国家和地区为64岁 中国人口平均预期寿命: 2000年71岁,其中男性69岁, 女性为73岁 日本81岁 瑞士79岁 德国78岁 澳大利亚79岁 加拿大79岁 美国78岁,2018/10/18,课程性质 专业基础课(考试) 学时/学分 64学时/4学分 理论课/实验课 56/8学时 课程内容 理论教学、实验、社会调查 考核方式 卷面测试占70%,平时成绩(包括出勤、课堂表现、作业等)占30%, 成绩评定 百分制记分,2018/10/18,指定教材: 统计学 贾俊平 中国人民大学出版社参考书: 统计学 袁
4、卫等 高等教育出版社统计学基础 刘玉玫 中国统计出版社统计学教程刘汉良 上海财经大学出版社 统计学 庞皓 西南财经大学出版社,2018/10/18,第一章 导论,主要内容,(1) 统计及其应用领域,(2) 统计数据及其类型,(3)统计中的基本概念,2018/10/18,1.1 统计及其应用领域,什么是统计?,统计工作,统计资料,统计学,统计工作是是搜集、整理、分析和研究统计数据资料的工作过程。,统计工作活动进行搜集、整理、分析和研究的主体及最终成果。,收集、处理、分析、解释数据并从数据中得出结论的科学 。,2018/10/18,三者之间的关系,统计工作,统计资料,统计学,工作与工作成果关系,实
5、践与理论关系,2018/10/18,1.1.1 什么是统计学?, 收集、处理、分析和解释数据的科学,1. 数据收集:取得数据 2. 数据处理:处理和展示 3. 数据分析:分析数据 4. 数据解释:结果的说明,统计学的研究对象是客观事物的数量特征和数据资料。统计学是以搜集、整理、分析和研究等统计技术为手段,对所研究对象的总体数量关系和数据资料去伪存真、去粗取精,从而达到显示、描述和推断被研究对象的特征、趋势和规律性的目的。,2018/10/18,statistics的定义 (不列颠百科全书),statistics: the science of collecting, analyzing, pr
6、esenting, and interpreting data. Copyright 1994-2000 Encyclopaedia Britannica, Inc.(不列颠百科全书),2018/10/18,统计研究的过程,实际问题,2018/10/18,统计规律 (一些例子),正常条件下新生婴儿的性别比为107:100 投掷一枚均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现16点的频率各为1/6 农作物的产量与施肥量之间存在相关关系,2018/10/18,统计方法,参数估计,假设检验,方差分析,回归分析,时间序列分析,描述统计,推断统计,统 计 方 法,2018/10/18,描
7、述统计(descriptive statistics),内容 搜集数据 整理数据 展示数据 描述性分析目的 描述数据特征 找出数据的基本规律,研究数据收集、处理、汇总、图表描述、概括与分析等的统计方法,2018/10/18,举例:互联网上各时间段的使用比例,2018/10/18,推断统计 (inferential statistics),内容 参数估计 假设检验 方差分析 回归分析 目的 对总体特征作出推断,研究如何利用样本数据来推断总体特征的统计方法,2018/10/18,反映客观现象的统计数据,描述统计学 (统计数据的收集、整理、显示和分析),概率论(分布理论、大数定律、中心极限定理),总
8、体内在的数量规律,推断统计学 (利用样本信息和概率论对总体数量特征进行估计并检验),统计学探索客观现象数量规律性的过程,描述统计与推断统计的关系,2018/10/18,1.1.2 统计学的应用领域,企业发展战略,经济预测,人力资源管理,财务分析,市场研究,产品质量管理,2018/10/18,统计的应用领域,actuarial work (精算) agriculture (农业) animal science (动物学) anthropology (人类学) archaeology (考古学) auditing (审计学) crystallography (晶体学) demography (人口
9、统计学) dentistry (牙医学) ecology (生态学) econometrics (经济计量学) education (教育学) election forecasting and projection (选举预测和策划) engineering (工程) epidemiology (流行病学) finance (金融) fisheries research (水产渔业研究) gambling (赌博) genetics (遗传学) geography (地理学) geology (地质学) historical research (历史研究) human genetics (人类
10、遗传学,2018/10/18,统计的应用领域,hydrology (水文学) industry (工业) linguistics (语言学) literature (文学) manpower planning (劳动力计划) management science (管理科学) marketing (市场营销学) medical diagnosis (医学诊断) meteorology (气象学) military science (军事科学) nuclear material safeguards (核材料安全管理) ophthalmology (眼科学) pharmaceutics (制药学
11、) physics (物理学) political science (政治学) psychology (心理学) psychophysics (心理物理学) quality control (质量控制) religious studies (宗教研究) sociology (社会学) survey sampling (调查抽样) taxonomy (分类学) weather modification (气象改善),2018/10/18,结论,统计学是一门应用性很强的学科,它为我们采取决策和行动提供依据和建议。它研究的是一系列的方法,即如何有效地收集、整理和分析受随机因素影响的数据,并对所考虑的
12、问题作出推断、预测和控制 。 注:统计只是一套分析数据的方法和工具,但它不是万能的。,2018/10/18,1.2 数据的类型,什么是统计数据?,采用某种计量尺度对现象进行计量的结果 不是指单个的数字,而是由多个数据构成的数据集 不仅仅是指数字,它可以是数字的,也可以是文字的,对现象进行测量的结果,2018/10/18,只进行分类或分组,不反映各类的优劣、量的大小或顺序,不可以进行数学运算;例如:将人口分为男女两类。,可以反映各类的优劣、量的大小或顺序,不可以进行数学运算;例如:将学生成绩分成优、良、中、及格和不及格五类 。,可以反映现象在量方面的精确差异,可以进行加、减运算;例如:某物长10
13、米,重100千克等。,相对数(或平均数),可以进行加、减、乘、除等数学运算,2018/10/18,2018/10/18,统计数据的分类 (按计量尺度分),分类数据(categorical data) 只能归于某一类别的非数字型数据; 对事物进行分类的结果; 数据表现为类别,用文字来表述; 例如,人口按性别分为男、女两类 ; 顺序数据(rank data) 只能归于某一有序类别的非数字型数据; 对事物类别顺序的测度 数据表现为类别,用文字来表述 例如,产品分为一等品、二等品、三等品、次品等 数值型数据(metric data) 对事物的精确测度 结果表现为具体的数值 例如:身高为175cm、16
14、8cm、183cm,2018/10/18,统计数据的分类 (按收集方法分),观测数据(observational data) 通过调查或观测而收集到的数据 在没有对事物人为控制的条件下而得到的 有关社会经济现象的统计数据几乎都是观测数据 试验数据(experimental data) 在试验中控制试验对象而收集到的数据 比如,对一种新药疗效的试验,对一种新的农作物品种的试验等 自然科学领域的数据大多数都为试验数据,2018/10/18,统计数据的分类 (按时间状况分),截面数据(cross-sectional data) 在相同或近似相同的时间点上收集的数据 描述现象在某一时刻的变化情况 比如
15、,2002年我国各地区的国内生产总值数据 时间序列数据(time series data) 在不同时间上收集到的数据 描述现象随时间变化的情况 比如,1996年至2002年国内生产总值数据,2018/10/18,1.3 统计中的几个基本概念,1.3.1 总体和样本1.3.2 参数和统计量1.3.3 变量,2018/10/18,1.3.1总体和样本,1、总体(population)-所研究的全部个体(数据)的集合 -分为有限总体和无限总体 有限总体的范围能够明确确定,且元素的数目是有限的 无限总体所包括的元素是无限的,不可数的问题: 如何确定总体?2、个体(Item Unit)-是构成统计总体的
16、个别事物(每一个元素),又称为总体单位。,2018/10/18,3、样本(Sample)是指从统计总体中抽取出来作为代表这一总体的、由部分个体组成的集合体。 4、样本量(Sample size)是指构成样本元素数目,或称样本容量。,2018/10/18,1、参数用来描述总体特征的概括性数字度量。研究者想要了解的总体的某种特征值.*所关心的参数主要有总体均值()、标准差()、总体比例()等*总体参数通常用希腊字母表示 2、统计量用来描述样本特征的概括性数字度量。根据样本数据计算出来的一个量 .*所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等*样本统计量通常用小写英文字母来
17、表示,1.3.2参数和统计量,2018/10/18,总体、个体与样本之间的关系,2018/10/18,说明现象某种特征的概念,可以取不同值的量。 如商品销售额、受教育程度、产品的质量等级等 变量的具体表现称为变量值,即数据 变量可以分为 分类变量(categorical variable) :说明事物类别的一个名称 顺序变量(rank variable ) :说明事物有序类别的一个名称 数值型变量(metric variable ) :说明事物数字特征的一个名称 离散变量:取有限个值 连续变量:可以取无穷多个值,变 量(Variable),2018/10/18,本章小节,1. 统计与统计学的含义 2. 统计数据与统计学的关系 3. 统计学的应用领域 4. 统计数据及其类型 5. 统计中的几个基本概念,