1、统计学 :张振华 Email: gailulun Y 密 gailulun2012 1, 加*是重点 2, 辅导:星期?晚上教学楼G103 3,学院:信息学院(院系楼2楼219),1.1 统计数据与统计学*,1. 数据搜集:取得数据 2. 数据整理:预处理 3. 数据分析:分析数据 4. 数据显示:图表展示数据数据解释或数据表述:结果的说明,统计学: 收集、整理、显示和分析数据的科学,一、统计学的研究对象、流程、方法,统计研究的过程,实际问题,二、统计、统计学、统计规律*,统计的3种不同含义:三种含义之间的关系* 1、统计工作搜集数据的活动 统计工作与统计资料是工作与结果的关系 2、统计资料与
2、统计数据对现象计量的结果 3、统计学 统计工作、统计资料与统计学是实践与理论的关系,统计学,“统计学是收集、分析、表述和解释数据的艺术与科学”(摘自不列颠百科全书),1.2 统计学的产生和发展*,一、古典统计学:一般认为产生于17世纪* 1.william patty-威廉.配第: 政治经济学之父 政治算数-社会经济统计学派 2.John Graunt-约翰.格朗特:人口统计学关于死亡表的自然观察与政治观察-社会经济统计学派 3.帕斯卡、费马、伽里略等:古典概率论学派 二、现代统计学 社会经济统计和数理统计仍然在以各自不同的方式发展着 1.戈塞特:小样本统计理论-t统计量 2.费希尔:F统计量
3、极大似然方差分析 3.奈曼皮尔逊:置信区间假设检验 4.沃尔德:序贯抽样统计决策等 5.不确定性分析的各种领域其它各新兴学派:经济/管理/金融/保险/文学/自然科学/医疗卫生/统计决策/不确定科学/数据挖掘/计算机,管理,.,理论,计量,统计学,描述统计学,推断统计学,参数估计,假设检验,理论统计学,应用统计学,统计工具,1.3.统计学分科:结构图*,1.3统计方法的分类与统计学的分科*,1.描述统计* (descriptive statistics),研究数据收集、整理和描述的统计学分支 内容 搜集数据 整理数据 展示数据 描述性分析目的 描述数据特征 找出数据的基本规律,描述统计,电冰箱消
4、费者对广告宣传途径的效果评价?,数据搜集 整理 描述 显示,您觉得哪种类型的广告宣传效果最好?(仅选一项) 1.电视 2.网络 3.杂志 4.报纸 5.路牌 6.宣传页,2.推断统计* (inferential statistics),研究如何利用样本数据来推断总体特征的统计学分支 内容 参数估计 假设检验 目的 对总体特征作出推断,3.描述统计与推断统计的关系*,反映客观现象的数据,总体内在的数量规律性,推断统计 (利用样本信息和概率论对总体的数量特征进行估计和检验等),概率论 (包括分布理论、大数定律和中心极限定理等),描述统计 (统计数据的搜集、整理、显示和分析等),总体数据,样本数据,
5、统计学探索现象数量规律性的过程,4.统计学的分科,统计学的分科,理论统计:研究统计学的一般理论、研究统计方法的数学原理 应用统计:研究统计学在各领域的具体应用,1.4 统计学的基本概念*,一、总体、个体和样本* 1. 总体(population):包含所研究的全部个体(数据)的集合。有限总体的范围能够明确确定,且元素的数目是有限的无限总体所包括的元素是无限的,不可数的 2. 总体单位/个体(single):构成统计总体的各个单位 总体中的每一个元素称为个体3. 样本 (sample): 从总体中抽取的一部分元素的集合 从总体中抽取的一部分元素的集合 构成样本的元素的数目称为样本容量,总体,样本
6、,总体、总体单位、样本关系,总体单位,二、 变量*,总体或者总体单位/个体所具有的特征或属性,用于标识总体或个体的差异性的变量因为总体中各单位的属性都存在基本的差异,是可变的,因而被称为变量。否则就是常量。 总体变量=指标=总体指标-总体参数(常、变量) 个体变量=标志=个体标志 样本变量=样本指标-样本统计量(常、变量)变量的数值:变量取值,三、参数和统计量*,参数(parameter)-总体参数 描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值 所关心的参数主要有总体均值()、标准差()、总体比例()等 总体参数通常用希腊字母表示 统计量(statistic)-样本统计量
7、用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数 所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等 样本统计量通常用小写英文字母表示,统计中的几个基本参数与统计量,例:中华人民共和国人口普查 总体:具有中华人民共和国国籍的所有公民 总体单位: 每位公民 变量 变量值 国籍: 中国(不变标志) 姓名: 张三 性别: 男 民族: 汉 婚姻状况: 已婚 家庭成员数: 4人(离散变量) 年龄: 50 (连续变量) 身高: 172cm 体重: 72.5kg 收入: 2000元/月,几种常用的统计软件 (Software),典型的统计软件 SAS SPSS MINITAB STATISTICA Excel Matlab Maple mathsmatic,本章小结,总体(全及)、个体-总体单位、样本 变量:指标/标志:品质+数量,平均+绝对+相对,标志与标志值,指标与指标值,参数与统计量 数据分类 直方图:次数分配数列+组距分组+分组原则+开口组 中位数众数平均数的代表性衡量:离散系数变异系数标准差系数 中心极限+大数定律 抽样极限误差+抽样平均误差+抽样标准差+ 不重复与重复抽样 样本比率=成数=交替标志 估计标准误,