1、概率论与数理统计是研究随机现象统计规律性的学科. 随机现象的规律性只有在相同的条件下进行大量重复试验时才会呈现出来. 也就是说,要从随机现象中去寻求必然的法则,应该研究大量随机现象.,从随机现象中发现统计规律,在实践中,不仅事件发生的频率具有稳定性,还有大量测量值的算术平均值也具有稳定性,大量抛掷硬币 正面出现频率,虚词使用频率,生产过程中的 废品率,大数定律的客观背景,切比雪夫不等式在数学上解释了方差能刻画随机变量取值的离散程度,即方差越小,X偏离其数学期望的概率越小,从而取值集中在附近。,切比雪夫不等式,切比雪夫不等式,例1(109.例1) 每一毫升血液的白细胞数平均是7300,均方差是7
2、00.用切比雪夫不等式估计每毫升血中白细胞数在5200与9400之间的概率。,切比雪夫不等式,测量值的算术平均值稳定在真实值的附近。,由切比雪夫不等式得:,设nA是n次独立重复试验中事件A发生的次数,p是事件A发生的概率,则对任意的0,有,贝努利大数定律,在数学上说明了频率的稳定性,在实际应用 中, 当试验次数很大时, 便可以用事件发生 的频率来代替事件的概率.,运用频率方法确定事件概率,对随机现象进行大量重复试验,则试验的结果是有规律的,正面概率:,0.5,中心极限定理的客观背景,有许多随机变量,它们是由大量的相互独立的随 机变量的综合影响所形成的,而其中每个个别的因 素作用都很小,这种随机
3、变量的极限分布就是正态 分布。,它在长达两个世纪的时期内曾是概率论研究的中 心课题,称为中心极限定理,设随机变量X1,X2,Xn相互独立,服从同一分布, 且E(Xi)=,D(Xi)=2,则,中心极限定理,(德莫佛-拉普拉斯定理)设随机变量X1,X2,Xn相互独立, 服从0-1分布,E(Xi)=p,D(Xi)=p(1-p),则,中心极限定理,已知 ,求 步骤为:,中心极限定理的应用步骤,确认n足够大,一般要求n50。,求出,标准化:,代入,例1(112,例2) 同型号的螺丝钉100个,该型号钉的 重量是一个随机变量,期望是100g,标准差是10kg ,求该盒钉重量超过10.2kg的概率。,中心极
4、限定理的应用,例1(112,例2) 同型号的螺丝钉100个,该型号钉的 重量是一个随机变量,期望是100g,标准差是10kg ,求该盒钉重量超过10.2kg的概率。,中心极限定理的应用,例2 设某种发光二极管的寿命服从期望为100小 时的指数分布,现随机取得160只,设它们的寿命是 相互独立的,求这160只元件的寿命的总和大于1920 小时的概率。,且Xi相互独立,,中心极限定理的应用,例2 设某种发光二极管的寿命服从期望为100小 时的指数分布,现随机取得160只,设它们的寿命是 相互独立的,求这160只元件的寿命的总和大于1920 小时的概率。,中心极限定理的应用,例3(112,例3) 计
5、算机进行运算时对小数点后第一 位四舍五入,误差XU-0.5,0.5,若运算100次, 求平均误差落在-3/20, 3/20的概率。,中心极限定理的应用,例3(112,例3) 计算机进行运算时对小数点后第一 位四舍五入,误差XU-0.5,0.5,若运算100次, 求平均误差落在-3/20, 3/20的概率。,中心极限定理的应用,所求概率为,例4(113,例4) 公司有200名员工参加考试,通过率 为0.8,求至少有150人通过考试的概率。,中心极限定理的应用,例4(113,例4) 公司有200名员工参加考试,通过率 为0.8,求至少有150人通过考试的概率。,中心极限定理的应用,所求概率为,例5
6、(113,例5) 保险公司要求被保险人每年交保险费 160元,若期间发生重大事故,可获2万赔金,已知 该市人员发生重大事故概率为0.005,现有5000人参 保,求收益在20万到40万元的概率。,中心极限定理的应用,例5(113,例5) 保险公司要求被保险人每年交保险费 160元,若期间发生重大事故,可获2万赔金,已知 该市人员发生重大事故概率为0.005,现有5000人参 保,求收益在20万到40万元的概率。,中心极限定理的应用,我们之前学会了可用一个连续型随机变量及其密度函数去描述2005年全国19000000新生婴儿的体重。如果完全知道了密度函数,就可以计算一个婴儿的体重在某个范围的概率
7、以及全国新生婴儿的平均体重和体重的标准差等数字特征,从而更清楚的了解全国新生婴儿的整体状况。但问题是如何求得体重的密度呢?,数理统计基础,在数理统计学中把研究对象的全体称为总体,而把组成总体的各个单元称为个体。实际问题关心的往往是总体某方面的数量特征,它是一个随机变量。所以统计学认为,总体就是一个随机变量X,它的分布称为总体分布。数理统计的基本问题就是推断总体的分布。,数理统计的基本问题就是推断总体的分布。,数理统计基础,一般地,在概率论中,随机变量的分布通常是假定已知的,概率问题大都是由已知的分布去求概率或数字特征等。但实际中怎样才能知道随机变量的分布呢?,数理统计基础,有没有必要把一锅汤喝
8、完?,日常生活中我们在煲汤时,如何评估一锅汤的味道?,舀一勺汤来品尝,从而推 测整锅汤的味道的方法称为 抽样。,为此,我们从所要研究的对象全体中抽取 部分进行观测(即抽样调查)以取得信息, 进而对整体作出推断。,数理统计基础,从总体X中抽取部分个体,称为抽样,即是 对X进行若干次观测,得到的就是n个随机变 量X1,X2, Xn ,称为样本,其中n为样本容 量,样本中的个体称为样品,样本观测值称 为样本值。,为使样本具有充分的代表性,常进行简单 随机抽样,即要求:,数理统计基础,样本有随机性:总体中每个个体入选的机会相等,即每个样品与总体同分布;,样本有独立性:每次抽样的结果不影响其它各次抽样的
9、结果,即相互独立。,简单随机抽样得到的样本称为简单随机样本。从 总体中进行有放回抽样,是简单随机抽样,得到简 单随机样本。当总体容量很大而样本容量较小时, 可近似看作有放回抽样,从而得到简单随机样本。,设总体分布为F(X),又因样本 X1,X2, Xn 相互独立,其联合分布函数为,数理统计基础,设总体密度为PX=xi=p(xi),又因样本 X1,X2, Xn 相互独立,其联合密度函数为,设总体密度为f(X),又因样本 X1,X2, Xn 相互独立,其联合密度函数为,设X1,X2,Xn为来自总体X的一个样 本,g( X1,X2,Xn )是一个不含任何未 知参数的连续函数,称g(X1,X2,Xn)
10、 为统计量。,统计量,统计量是样本的函数,也是随机变量,具有概率分布。把统计量的概率分布称为抽样分布。,设(X1,X2,Xn)为来自总体X的简单随机样本。,常用于估计总体分布的均值,或 检验有关总体分布均值的假设。,2.样本方差:,用于估计总体分布的方差。式中的n1称为S2的自由度(式中含有独立变量的个数),S称为样本标准差,又称为标准误。,3.样本矩:,K 阶原点矩:,K 阶中心矩:,1.样本均值:,常用统计量,总体,样本,采集数据抽样,统计量,进行加工,对总体作 出推断,对统计量分析,数理统计以概率论为基础,研究如何搜集资料,并对统计资料 进行整理和分析,对整体的某些性质作出推断,数理统计研究方法流程图,