收藏 分享(赏)

matlab数理统计.ppt

上传人:精品资料 文档编号:10500014 上传时间:2019-11-23 格式:PPT 页数:46 大小:1.13MB
下载 相关 举报
matlab数理统计.ppt_第1页
第1页 / 共46页
matlab数理统计.ppt_第2页
第2页 / 共46页
matlab数理统计.ppt_第3页
第3页 / 共46页
matlab数理统计.ppt_第4页
第4页 / 共46页
matlab数理统计.ppt_第5页
第5页 / 共46页
点击查看更多>>
资源描述

1、1,数学实验,第十讲 数理统计的matlab求解,Matlab介绍,一、统计量,2019/11/23,中国人民大学六西格玛质量管理研究中心,4,偏度系数的意义由图2-1可表示出来。 图2-1,目录 上页 下页 返回 结束,2019/11/23,中国人民大学六西格玛质量管理研究中心,5,峰度用峰度系数表示:,目录 上页 下页 返回 结束,二、基本统计量,对随机变量x,计算其基本统计量的命令如下:均值:mean(x) 中位数:median(x) 标准差:std(x) 方差:var(x) 偏度:skewness(x) 峰度:kurtosis(x),2019/11/23,7,随机变量的数字特征,随机变

2、量的数学期望,1.数组的平均值-Y=mean(X) 功能:当X为向量时,输出一个平均数;当X为矩阵时,输出为行向量,对应于矩阵每列的平均值;因此计算矩阵所有数的平均值,应用嵌套:mean(mean(X)或m=mean(X(:) 与此类似的有:求和(sum),最大(max),最小(min)等 2.离散型随机变量的期望-EX=sum(X.*P) 功能:计算随机值向量X与对应概率向量P的乘积之和 3.连续型随机变量的期望-EX=int(x*fx,x,a,b) 功能:用积分计算期望,2019/11/23,8,随机变量的数字特征,例4设随机变量X的分布列,求期望。,程序:clear; x=-1,0,2,

3、3; p=1/8,1/4,3/8,1/4; EX=sum(x.*p) 1.3750,2019/11/23,9,3.3 随机变量的数字特征,例3.5设随机变量X的分布密度为:且EX=3/5,求常数a,b的值。,程序:clear;syms a b x;fx=a+b*x2; EX=int(x*fx,x,0,1) EX=1/4*b+1/2*a F=int(fx,x,0,1) F=a+1/3*b f1=EX-3/5;f2=F-1; a,b=solve(f1,f2) a=3/5,b=6/5,2019/11/23,10,3.3 随机变量的数字特征,例3.6设随机变量X的分布密度为:求随机变量Y=|X|的期望

4、。,程序:clear;syms x; fx1=0.5*exp(x); fx2=0.5*exp(-x); EY=int(-x*fx1,x,-inf,0) + int(x*fx2,x,0, inf) EY= 1,2019/11/23,11,随机变量的数字特征,随机变量的方差,1.统计数据的方差-D=var(X,1) 功能:当X为向量时,输出一个标量;当X为矩阵时,输出为行向量,对应于矩阵每列的方差值;因此计算矩阵所有数的方差值,应用嵌套:var(var(X)缺省1,计算:否则计算: 2.统计数据的标准差-S=std(X,1) 功能:用法和1的解释同上 3. 一般随机变量的方差-DX=E(X2)-(

5、EX)2 功能:用积分或级数编程计算,2019/11/23,12,随机变量的数字特征,例3.7设随机变量X的分布密度为:求随机变量X的期望和方差。,程序:clear;syms x;fx=2/pi*cos(2*x); EX=int(x*fx,x,-pi/2,pi/2) E2X=int(x2*fx,x,-pi/2,pi/2) DX=E2X-EX2,2019/11/23,13,随机变量的数字特征,常见分布的期望和方差,1.二项分布-E,D=binostat(n,p) 说明:n,p可以是标量,向量,矩阵,则E,D是对应的标量,向量,矩阵 2.超几何分布-E,D=hygestat(M,N,K) 3.泊松

6、分布-E,D=poissstat(lambda) 4.均匀分布-E,D=unifstat(a,b) 5.指数分布-E,D=expstat(lambda) 6.正态分布-E,D=normstat(mu,sigma) 其他:gamstat(),tstat(),fstat(),chi2stat()等等,2019/11/23,14,随机变量的数字特征,协方差与相关系数的计算,1.随机变量的协方差-cov(X,Y)=E(X-EX)(Y-EY) 2.随机变量的相关系数-=cov(X,Y)/sqrt(DX*DY) 3.统计数据的协方差 cov(X)-当X为向量时,cov(X)=var(X);当X为矩阵时,结

7、果为X的协方差矩阵.对角线是X每列的方差,Xij为X的第i列和第j列的协方差值。 cov(X,Y)-计算向量X和Y的协方差值 4.统计数据的相关系数 corrcoef(X),corrcoef(X,Y)-说明与用法与cov()相同,2019/11/23,15,3.3 随机变量的数字特征,矩的计算,1.随机变量的k阶中心矩-Bk=moment(X,k)2.随机变量的k阶原点矩-Ak=sum(X.k)/length(X),三、常见概率分布的函数,MATLAB工具箱对每一种分布都提供5类函数,其命令字符为: 概率密度:pdf 概率分布:cdf 逆概率分布:inv 均值与方差:stat 随机数生成:rn

8、d,(当需要一种分布的某一类函数时,将以上所列的分布命令字符与函数命令字符接起来,并输入自变量(可以是标量、数组或矩阵)和参数即可.),在MATLAB中输入以下命令: x=-6:0.01:6; y=normpdf(x); z=normpdf(x,0,2); plot(x,y,x,z),1密度函数:p=normpdf(x,mu,sigma) (当mu=0,sigma=1时可缺省),如对均值为mu、标准差为sigma的正态分布,举例如下:,3逆概率分布:x=norminv(P,mu,sigma). 即求出x ,使得PXx=P.此命令可用来求分位数.,2概率分布:P=normcdf(x,mu,sig

9、ma),4均值与方差:m,v=normstat(mu,sigma),例5 求正态分布N(3,52)的均值与方差.命令为:m,v=normstat(3,5)结果为:m=3,v=25,5随机数生成:normrnd(mu,sigma,m,n).产生mn阶的正态分布随机数矩阵.,例6 命令:M=normrnd(1 2 3;4 5 6,0.1,2,3)结果为:M=0.9567 2.0125 2.88543.8334 5.0288 6.1191,此命令产生了23的正态分布随机数矩阵,各数分别服从分布:N(1,0.12), N(2,22), N(3, 32), N(4,0.12), N(5, 22), N(

10、6, 32).,1给出数组data的频数表的命令为: N,X=hist(data,k)此命令将区间min(data),max(data)分为k个小区间(缺省为10),返回数组data落在每一个小区间的频数N和每一个小区间的中点X.,2描绘数组data的频数直方图的命令为: hist(data,k),四、直 方 图 的 描 绘,2019/11/23,21,随机变量及其分布,注:以后碰到命令末尾为: rnd-产生随机数X; cdf-产生分布函数F(x) pdf-产生密度函数p(x)或分布列Px=PX=x inv-计算x=F-1(p) p=F (x),2019/11/23,22,常见分布的随机数产生

11、,2019/11/23,23,专用函数计算概率密度函数表,2019/11/23,24,专用函数的累积概率值函数表,2019/11/23,25,常用临界值函数表,2019/11/23,26,常见分布的均值和方差,2019/11/23,27,随机变量及其分布,例3.1某人向空中抛硬币100次,落下为正面的概率为0.5。这100次中正面向上的次数记为X: (1)试计算x=45的概率和x45的概率; (2)绘制分布函数图象和分布列图象。,程序:clear; px=pdbinof(45,100,0.5) % 计算x=45的概率px = 0.0485 fx=binocdf(45,100,0.5) % 计算

12、x45的概率fx =0.1841 x=1:100;p1=binocdf(x,100,0.5);plot(x,p1,+); title(分布函数图),2019/11/23,28,3.1 随机变量及其分布,p2=binopdf(x,100,0.5);plot(x,p2,*r);title(概率分布图),2019/11/23,29,3.1 随机变量及其分布,例3.2设XN(2,0.25) (1) 求概率P1X2.5; (2)绘制分布函数图象和分布密度图象; (3)画出区间1.5,1.9上的分布密度曲线下方区域。,程序:(1)p=normcdf(2.5,2,0.5)- normcdf(1,2,0.5)

13、 p = 0.8186 (2) x=0:0.1:4;px=normpdf(x,2,0.5); fx= normcdf(x,2,0.5); plot(x,px,+b);hold on; plot(x,fx,*r);legend(正态分布函数,正态分布密度); (3) specs=1.5,1.9; pp=normspec(specs,2,0.5),2019/11/23,30,3.1 随机变量及其分布,31,3.4 参数估计,常用分布的参数估计,1.正态分布的参数估计 格式:muhat,sigmahat,muci,sigmaci=normfit(X,alpha) 功能:数组X服从正态分布,给定显著水

14、平alpha,缺省时为0.05,前二项给出点估计,后二项给出区间估计。X为矩阵时,针对列进行计算。 2.二项分布的参数估计(n重已知,p未知) 格式:phat,puci=binofit(X,n,alpha) 3.泊松分布的参数估计 格式:lbdhat,lbdci=poissfit(X, alpha) 4.均匀分布的参数估计 格式:ahat,bhat,aci,bci=unifit(X,alpha),2019/11/23,32,3.4 参数估计,5.指数分布的参数估计 格式:lbdhat, lbdci=expfit(X,alpha) 6.通用命令mle() 格式:输出参数项=mle(分布函数名,X

15、,alpha ,N) 说明:分布函数名有:bino(二项),geo(几何),hyge(超几何) poiss(泊松),uinf(均匀),unid(离散均匀),exp(指数) norm(正态),t(T分布),f(F分布),beta(贝塔),gam(伽吗) N当二项时需要,其他没有。,2019/11/23,33,例3.8设生成一组均值为15,方差为2.52的正态分布的随机数据,然后对这组数据进行置信度97%的参数估计。,程序:clear; w=normrnd(15,2.5,50,1); 或w=15+2.5*randn(50,1); alpha=0.03; mh,sh,mc,sc=normfit(w,

16、alpha) 运行一次:mh=15.1076sh=2.4038mc=14.347815.8674sc=1.97093.0703,3.4 参数估计,2019/11/23,34,例3.9设从一大批产品中抽取100个产品,经检验知有60个一级品,求这批产品的一级品率(置信度95%)。,程序:clear; alpha=0.05;N=100;X=60; Ph,Pc=mle(bino,X,alpha,N)运行一次:Ph=0.6000Pc=0.49720.6967,3.4 参数估计,五、参数估计,1正态总体的参数估计,设总体服从正态分布,则其点估计和区间估计可同时由以下命令获得:muhat,sigmahat

17、,muci,sigmaci=normfit(X,alpha),此命令在显著性水平alpha下估计数据X的参数(alpha缺省时设定为0.05),返回值muhat是X的均值的点估计值,sigmahat是标准差的点估计值, muci是均值的区间估计,sigmaci是标准差的区间估计.,2其它分布的参数估计,有两种处理办法: 一、取容量充分大的样本(n50),按中心极限定理,它近似地服从正态分布;二、使用MATLAB工具箱中具有特定分布总体的估计命令.,(1)muhat, muci = expfit(X,alpha) 在显著性水平alpha下,求指数分布的数据X的均值的点估计及其区间估计. (2)l

18、ambdahat, lambdaci = poissfit(X,alpha) 在显著性水平alpha下,求泊松分布的数据X的参数的点估计及其区间估计. (3)phat, pci = weibfit(X,alpha) 在显著性水平alpha下,求Weibull分布的数据X的参数的点估计及其区间估计.,六、假设检验,在总体服从正态分布的情况下,可用以下命令进行假设检验.,1总体方差 已知时,总体均值的检验使用 z检验,h,sig,ci = ztest(x,m,sigma,alpha,tail) 检验数据 x 的关于均值的某一假设是否成立,其中sigma 为已知方差, alpha 为显著性水平,究竟

19、检验什么假设取决于 tail 的取值: tail = 0,检验假设“x 的均值等于 m ” tail = 1,检验假设“x 的均值大于 m ” tail =-1,检验假设“x 的均值小于 m ” tail的缺省值为 0, alpha的缺省值为 0.05.,返回值 h 为一个布尔值,h=1 表示可以拒绝假设,h=0 表示不可以拒绝假设,sig 为假设成立的概率,ci 为均值的 1-alpha 置信区间.,例7 MATLAB统计工具箱中的数据文件gas.mat.中提供了美国1993年1月份和2月份的汽油平均价格(price1,price2分别是1、2月份的油价,单位为美分),它是容量为20的双样本

20、.假设1月份油价的标准偏差是每加仑4分币(=4),试检验1月份油价的均值是否等于115.,解 作假设:m = 115. 首先取出数据,用以下命令:load gas 然后用以下命令检验h,sig,ci = ztest(price1,115,4),返回:h = 0,sig = 0.8668,ci = 113.3970 116.9030.,检验结果: 1. 布尔变量h=0, 表示不拒绝零假设. 说明提出的假设均值115 是合理的. 2. sig值为0.8668, 远超过0.5, 不能拒绝零假设 3. 95%的置信区间为113.4, 116.9, 它完全包括115, 且精度很高. .,2总体方差 未知

21、时,总体均值的检验使用t 检验,h,sig,ci = ttest(x,m,alpha,tail) 检验数据 x 的关于均值的某一假设是否成立,其中alpha 为显著性水平,究竟检验什么假设取决于 tail 的取值: tail = 0,检验假设“x 的均值等于 m ” tail = 1,检验假设“x 的均值大于 m ” tail =-1,检验假设“x 的均值小于 m ” tail的缺省值为 0, alpha的缺省值为 0.05.,返回值 h 为一个布尔值,h=1 表示可以拒绝假设,h=0 表示不可以拒绝假设,sig 为假设成立的概率,ci 为均值的 1-alpha 置信区间.,返回:h = 1,

22、sig = 4.9517e-004,ci =116.8 120.2.,检验结果: 1. 布尔变量h=1, 表示拒绝零假设. 说明提出的假设油价均值115是不合理的. 2. 95%的置信区间为116.8 120.2, 它不包括115, 故不能接受假设.3. sig值为4.9517e-004, 远小于0.5, 不能接受零假设.,例8 试检验例8中2月份油价price2的均值是否等于115.,解 作假设:m = 115, price2为2月份的油价,不知其方差,故用以下命令检验 h,sig,ci = ttest( price2 ,115),3两总体均值的假设检验使用 t 检验,h,sig,ci =

23、ttest2(x,y,alpha,tail) 检验数据 x ,y 的关于均值的某一假设是否成立,其中alpha 为显著性水平,究竟检验什么假设取决于 tail 的取值: tail = 0,检验假设“x 的均值等于 y 的均值 ” tail = 1,检验假设“x 的均值大于 y 的均值 ” tail =-1,检验假设“x 的均值小于 y 的均值 ” tail的缺省值为 0, alpha的缺省值为 0.05.,返回值 h 为一个布尔值,h=1 表示可以拒绝假设,h=0 表示不可以拒绝假设,sig 为假设成立的概率,ci 为与x与y均值差的的 1-alpha 置信区间.,返回:h = 1,sig =

24、 0.0083,ci =-5.8,-0.9.,检验结果:1. 布尔变量h=1, 表示拒绝零假设. 说明提出的假设“油价均值相同”是不合理的. 2. 95%的置信区间为-5.8,-0.9,说明一月份油价比二月份油价约低1至6分.3. sig-值为0.0083, 远小于0.5, 不能接受“油价均相同”假设.,例9 试检验例8中1月份油价price1与2月份的油价price2均值是否相同.,解 用以下命令检验 h,sig,ci = ttest2(price1,price2),4非参数检验:总体分布的检验,MATLAB工具箱提供了两个对总体分布进行检验的命令:,(1)h = normplot(x),(

25、2)h = weibplot(x),此命令显示数据矩阵x的正态概率图.如果数据来自于正态分布,则图形显示出直线性形态.而其它概率分布函数显示出曲线形态.,此命令显示数据矩阵x的Weibull概率图.如果数据来自于Weibull分布,则图形将显示出直线性形态.而其它概率分布函数将显示出曲线形态.,返回,例10 一道工序用自动化车床连续加工某种零件,由于刀具损坏等会出现故障.故障是完全随机的,并假定生产任一零件时出现故障机会均相同.工作人员是通过检查零件来确定工序是否出现故障的.现积累有100次故障纪录,故障出现时该刀具完成的零件数如下:459 362 624 542 509 584 433 74

26、8 815 505612 452 434 982 640 742 565 706 593 680926 653 164 487 734 608 428 1153 593 844527 552 513 781 474 388 824 538 862 659775 859 755 49 697 515 628 954 771 609402 960 885 610 292 837 473 677 358 638699 634 555 570 84 416 606 1062 484 120447 654 564 339 280 246 687 539 790 581621 724 531 512 57

27、7 496 468 499 544 645764 558 378 765 666 763 217 715 310 851 试观察该刀具出现故障时完成的零件数属于哪种分布.,解 1数据输入,2作频数直方图hist(x,10),3分布的正态性检验normplot(x),4参数估计:muhat,sigmahat,muci,sigmaci=normfit(x),(看起来刀具寿命服从正态分布),(刀具寿命近似服从正态分布),估计出该刀具的均值为594,方差204, 均值的0.95置信区间为 553.4962,634.5038, 方差的0.95置信区间为 179.2276,237.1329.,5假设检验,已知刀具的寿命服从正态分布,现在方差未知的情况下,检验其均值 m 是否等于594.,结果:h = 0,sig = 1,ci =553.4962,634.5038.,检验结果: 1. 布尔变量h=0, 表示不拒绝零假设. 说明提出的假设寿命均值594是合理的.2. 95%的置信区间为553.5,634.5, 它完全包括594, 且精度很高.3. sig值为1, 远超过0.5, 不能拒绝零假设.,返回,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报