1、录播课程,一、数理统计及其任务,数理统计是一门以概率论为基础的应用学科。 它是研究如何有效地收集、 整理、分析带有随机性的数据,以便对所考察的问题作出推断和预测,从而为决策提供依据。,数据的随机性来源有二:一是由于种种原因(如所涉及的研究对象数量很大),人们不可能对其全部进行研究,而只能以一定方式挑选其中一部分考察,这一部分的挑选就必然带有随机性;二是试验的随机误差,这是指试验中无法控制或未加控制,甚至不了解的因素引起的误差。,数理统计的任务就是研究有效地收集数据,科学地整理与分析所获得的有限的资料,对所研究的问题, 尽可能地作出精确而可靠的结论。,有效地收集数据有两方面的含义:一是可以建立一
2、个数学上可处理并尽可能简单方便的模型来描述所得到的数据;二是要收集包含尽可能多的与所研究的问题有关的信息。,数理统计研究问题的方式,不是对所研究对象的全体 ( 称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断。,数理统计方法具有“部分推断整体”的特征。,二、数理统计研究问题的一般流程,我们这门课所学的数理 统计实际上是统计推断 及其应用(方差分析与 回归分析)的一部分内 容。,为什么要用数理统计方法研究问题?随机现象有它的规律性,随机现象的特点注定了进行足够多次观察,其规律性才能清楚地呈现出来。但是,客观上只允许对随机现象进行有限次观察试
3、验,只能获得局部观察资料.,三、概率论与数理统计的区别与联系,1、概率论与数理统计的联系,2、概率论与数理统计的区别,主要体现在研究方法的差别上:概率论是在已知随机变量服从某种分布(概率函数、概率密度、分布函数)的情况下,研究随机变量分布的性质,数字特征和它的应用。例如:已知随机变量的概率密度求它的分布函数、数学期望、方差;已知随机变量的分布求其函数的分布等,而数理统计则是通过对样本数据的统计分析,从中得到能够描述研究对象的某个随机变量的具体分布和数字特征,以此推断对象整体所具有的规律。前者用的是演绎法,后者用的是归纳法。,都以随机现象为对象,研究其统计规律性。,总之,数理统计是研究怎样以有效
4、的方式收集、整理、分析带随机性的数据,并在此基础上,对所研究的问题做出统计推断,直至对可能作出的决策提供依据或建议。概率论为数理统计提供理论基础。数理统计的核心问题由样本推断总体. 计算机的诞生与发展为数据处理提供了强有力的技术支持,数理统计与计算机的结合是必然的发展趋势.国内外著名的统计软件包: SAS,SPSS,STAT 等,都可以让你快速、简便地进行数据处理和分析.但由于学时有限,这部分内容的重点在于介绍数理统计的一些重要概念和典型的统计方法,它们是实际中最常用的知识. 学习统计无须把过多时间花在计算上,应更有效地把时间用在基本概念、方法原理的正确理解上.,本课程主要学习数理统计的基本概
5、念与抽样分布、参数估计、假设检验、方差分析和线性回归分析。,具体知识:,1、总体、个体、样本,统计量、次序统计量、经验分布函数和直方图,样本均值、样本方差、样本标准差 、样本高阶矩,样本均值的分布、正态总体样本的线性函数的分布,三类重要分布,抽样分布定理;,2、矩法、极大似然估计法,无偏性、有效性、相合性,充分统计量,区间估计的定义、枢轴量法、单个正态总体均值的置信区间、单个正态总体方差的置信区间、两个正态总体均值差的置信区间、两个正态总体方差比的置信区间、(01)分布参数的置信区间 ;,3、假设检验的概念与步骤,参数假设检验:单个正态总体均值的检验、单个正态总体方差的检验、两个正态总体均值差
6、的检验、两个正态总体方差比的检验,非参数假设检验:拟合优度检验、列联表的独立性检验; 4、方差分析:单因子方差分析、双因子方差分析,线性模型,最小二乘估计量、最小二乘估计量的性质。,本课程的学习目的、方法,1(1)理解总体、个体、样本、经验分布函数、样本高阶矩等基本概念,掌握样本的联合分布函数、统计量、次序统计量、样本均值、样本方差和样本标准差,并会计算; (2)会求样本均值、正态总体样本的线性函数,理解并掌握三类重要分布的定义、基本性质,会运用抽样分布定理解决实际问题;,2 知道点估计的基本原理,会用矩法和极大似然法求未知参数的点估计,理解充分统计量,掌握点估计的优良性和区间估计的方法,会求
7、单(两)个正态总体均值、方差的有关置信区间; 3 理解假设检验的概念和步骤,掌握正态总体均值、方差的假设检验,会用拟合优度检验和列联表的独立性检验;,4 知道单(双)因子方差分析,了解线性模型,理解最小二乘估计的定义和性质。本课程采用网上学习、课后自学的方法,大约需54课时。,第一章 介绍数理统计的基本概念,1 随机样本 (1)基本概念:总体、个体、样本、样本容量、简单随机样本、简单随机抽样; (2)随机样本的分布函数; (3)随机样本的概率密度或概率分布律。,2 统计量 (1)统计量的定义、次序统计量、经验分布函数、直方图、格里汶科定理; (2)样本的数字特征:样本均值、样本方差、样本标准差
8、、样本k阶原点矩、样本k阶中心矩、样本偏度、样本峰度。,3 抽样分布(1)抽样分布的定义(2)样本均值、正态总体样本的线性函数的分布。 4 三类重要分布 (1) 分布:定义,概率密度,特征函数、期望与方差,可加性; (2)t分布:定义,概率密度,极限分布,期望与方差; (3)F分布:定义,概率密度,期望与方差,其他性质。5 抽样分布定理及推论,第二章 讨论参数估计理论,1 点估计 (1)矩估计法:定义,具体步骤 ; (2)极大似然估计法:定义,具体步骤,渐近正态性 。 2 估计量的评选标准 (1)无偏性:无偏估计,一致最小方差无偏估计 ; (2)有效性: C-R不等式,有效估计,有效率; (3
9、)相合性:弱相合估计,强相合估计,均方一致估计。,3 充分估计量 定义,判别定理。 4 区间估计 (1)区间估计的定义与枢轴量法; (2)正态总体的区间估计。,第三章 介绍假设检验的初步理论,1 假设检验的基本概念与步骤 (1)假设,原假设,备择假设,假设检验,显著性水平,临界值,两类错误,势函数; (2)假设检验的分类与步骤;,2 参数假设检验 (1)单个正态总体均值的检验法:方差已知的U检验,方差未知的T检验; (2)单个正态总体的 检验法:均值已知,均值未知; (3)两个正态总体均值差的检验法:方差已知的U检验,方差未知的T检验; (4)两个正态总体方差比的F检验法:均值已知,均值未知。 (5)(01)分布参数的置信区间 。,3 非参数假设检验 (1)x2 拟合优度检验; (2)列联表的独立性检验 。,第四章 介绍方差分析和线性回归分析的初步知识,1 方差分析 (1)单因子方差分析; (2)双因子方差分析:无重复观察的双因子方差分析,有重复观察的双因子方差分析。,2 线性模型的定义 3 最小二乘估计 (1)最小二乘估计的定义; (2)最小二乘估计量的基本性质; (3)关于参数的假设检验和置信区间。,