1、数理统计实验实验指导书一理学院实验中心数学专业实验室编写实验一 常见的概率分布以及分位数【实验类型】综合性【实验学时】4【实验内容】1、会利用 MATLAB 软件计算离散型随机变量的概率、连续型随机变量概率密度值, 以及产生离散型随机变量的概率分布(即分布律);2、会利用 MATLAB 软件画出各种常见分布图形;2、会利用 MATLAB 软件计算分布函数值, 或计算形如事件Xx的概率;3、给出概率 p 和分布函数, 会求上 分位点, 或求解概率表达式中的待定参数。 【实验前的预备知识】1、掌握常见离散型随机变量的分布律及性质; 2、掌握常见连续型随机变量的分布密度函数及性质;3、理解上分位数的
2、定义及求法4、掌握基本的描绘函数的 MATLAB 编程法。【实验方法或步骤】1、 通用 MATLAB 函数计算概率分布律及密度函数值命令 通用函数计算概率密度函数值函数 pdf 或者 namepdf格式: Y=pdf(name,K, A,B)或者:namepdf (K,A,B) 说明(1)上述函数表示返回在 X=K 处、参数为 A、B、C 的概率值或密度值,对于不同的分布,参数个数是不同;name 为分布函数名,其取值如表 1。(2)第一个函数名加 ,第二个无需加。表 1 常见分布函数表name 的取值 函数说明beta 或 Beta Beta 分布bino 或 Binomial 二项分布ch
3、i2 或 Chisquare 卡方分布exp 或 Exponential 指数分布f 或 F F 分布gam 或 Gamma GAMMA 分布geo 或 Geometric 几何分布hyge 或 Hypergeometric 超几何分布logn 或 Lognormal 对数正态分布nbin 或 Negative Binomial 负二项式分布ncf 或 Noncentral F 非中心 F 分布nct 或 Noncentral t 非中心 t 分布ncx2 或 Noncentral Chi-square 非中心卡方分布norm 或 Normal 正态分布poiss 或 Poisson 泊松分布
4、rayl 或 Rayleigh 瑞利分布t 或 T T 分布unif 或 Uniform 连续均匀分布unid 或 Discrete Uniform 离散均匀分布weib 或 Weibull Weibull 分布例 1 事件 A 在每次试验中发生的概率是 0.3, 计算在 10 次试验中 A 恰好发生 6 次的概率. 解: p=pdf(bino,6, 10, 0.3)或者 p=binopdf(6, 10, 0.3) p = 0.0368 结果表明: 参数是 n=10,概率是 p=0.3 的二项分布在 X=6 处的概率为 0.0368. 例 2 事件 A 在每次试验中发生的概率是 0.3, 求在
5、 4 次试验中 A 发生次数的概率分布.解: p=pdf(bino,0:4,4,0.3) %0: 4 产生步长为 1 的等差数列 0, 1, 2, 3, 4. 或者 p=binopdf(0:4,4,0.3)p = 0.2401 0.4116 0.2646 0.0756 0.0081 计算的结果是: 参数是 n=4, 概率是 p=0.3 的二项分布的分布律(当 x=0,1,2,3,4 时). 例 3 设随机变量 X 服从参数是 3 的泊松分布, 求概率 PX=6. 解: p=pdf(poiss,6,3)或者 p=poisspdf(6,3) p = 0.0504 结果表明:参数是 =3 的泊松分布
6、在 x=6 处的概率为 0.0504. 例 4 写出参数为 3 的泊松分布的前 6 项的概率分布. 解: p=pdf(poiss,0:5,3)或者 p=poisspdf(0:5,3) % 0:5 产生步长为 1 的等差数列 0,1,2,3,4,5. p = 0.0498 0.1494 0.2240 0.2240 0.1680 0.1008 计算的结果是, 参数为 =3 的泊松分布的前 6 项的概率(当 x=0,1,2,3,4,5 时). 例 5 设随机变量 X 服从区间 2, 6上的均匀分布, 求 X=4 时的概率密度值. 解:y=unifpdf(4,2,6) 或 y=pdf(unif,4,2
7、,6)y = 0.2500 例 6 计算正态分布 N(0,1 )的随机变量 X 在点 0.6578 的密度函数值。解:在命令窗口中输入: pdf(norm,0.6578,0,1)或者 normpdf(0.6578,0,1)ans =0.3213例 7 自由度为 8 的卡方分布,在点 2.18 处的密度函数值。解: pdf(chi2,2.18,8)或者 chi2pdf(2.18,8)ans =0.03632、常见分布的密度函数作图函数:plot(x,y) 或 plot(x,y) 以 x 元素为横坐标值,y 元素为纵坐标值绘制曲线。例:1、二项分布x = 0:10;y = binopdf(x,10
8、,0.5);plot(x,y,+)2、泊松分布x = 0:15;y = poisspdf(x,5);plot(x,y,+)0 2 4 6 8 0 2 0 5 0 1 2 图 1-23、指数分布x = 0:0.1:10;y = exppdf(x,2);plot(x,y)4、正态分布x=-3:0.2:3;y=normpdf(x,0,1);plot(x,y) 1 2 3 4 5 0 1 2 30 2 3 4 图 3-45、卡方分布x = 0:0.2:15;y = chi2pdf(x,4);plot(x,y) 6、F 分布x = 0:0.01:10;y = fpdf(x,5,3);plot(x,y)
9、5 0 1 2 4 6 8 02 4 6 8 图 5-67、T 分布x = -5:0.1:5;y = tpdf(x,5);z = normpdf(x,0,1);plot(x,y,-,x,z,-.)8、 分布x = gaminv(0.005:0.01:0.995),100,10);y = gampdf(x,100,10);y1 = normpdf(x,1000,100);plot(x,y,-,x,y1,-.) 0 501 2 3 4 0 0 0 012345 图 7-83、随机变量的累积概率值(分布函数值 )函数 cdf 或者 namecdf格式 cdf (name ,K,A,B)或者 name
10、cdf (K,A,B)说明 返回以 name 为分布、随机变量 XK 的概率之和的累积概率值,name 的取值见表 1 常见分布函数表例 8 设随机变量 X 服从参数是 3 的泊松分布, 求概率 PX6 。 解: p=poisscdf(6,3) % 比较例 2-4 命令 poisspdf(6,3). p = 0.9665 结果表明:参数是 =3 的泊松分布在 x=6 处的分布函数值 F(6)=PX 6=0.9665 . 例 9 求标准正态分布随机变量 X 落在区间(-,0.4) 内的概率(该值就是概率统计教材中的附表:标准正态数值表) 。解:cdf(norm,0.4,0,1)ans =0.65
11、54例 10 求自由度为 16 的卡方分布随机变量在0,6.91 内的概率 .chi2cdf(6.91,16)ans =0.02504、随机变量的逆累积分布函数与上侧 分位数逆累积分布函数是已知 ,求 ,显然上侧 分位数满足()FxPXx。()1-Fx逆累积分布函数值的计算有两种方法:函数:icdf 或者 nameinv格式:icdf(name, K,A,B)或者 nameinv(K,A,B) 说明 返回分布为 name,参数为 A,B, 累积概率值为 K 的临界值,即满足的 ,这里 name 与前面表 1 相同。()xPXx例 11 在标准正态分布表中,若已知 =0.975,求 x)x(解:
12、 x=icdf(norm,0.975,0,1)或者 norminv(0.975,0,1)x =1.9600例 12 在 分布表中,若自由度为 10, =0.975,求上侧 分位数。2解: icdf(chi2,0.025,10)或者 chi2inv(0.025,10)ans =3.2470例 13 在假设检验中,求临界值问题:已知: ,查自由度为 10 的双边界检验 t 分布临界值05.x=icdf(t,0.025,10)x =-2.2281例 14 分布的逆累积分布函数的综合应用:绘制 分布的概率密度图形 , 在指定区域对图形填色, 在指定位置标注文字、标注数字.解 在命令窗口中输入: n=5
13、; a=0.9; % n 为自由度, a 为置信水平或累积概率. xa=chi2inv(a,n) ; %求 中的 . x=0:0.1:15; px=chi2pdf(x,n) ; %计算概率密度函数值,供绘图用. plot(x,px,b); hold on %绘概率密度函数图形, 用蓝色线条. xx=0:0.1:xa; pxx=chi2pdf(xx,n) ; %计算0,xa上的密度函数值,供填色用. fill(xx,xa, pxx,0, g) %在区域 xx,xa, pxx,0填绿色, 点(xa, 0)使得填色区域封闭. 注意, 不是区域xx,xa, 0,pxx. text(xa*1.01,0.
14、01, num2str(xa) %在起始点(xa*1.01,0.01) 标注临界值点的具体数值. 命令 num2str(xa)是将 xa 的数值转换为字符串. text(10,0.10, fontsize16Xchi2(5) %在图中指定位置标注文字,字号是 fontsize16. text(1.5,0.05, fontsize22alpha=0.9) %在图中指定位置标注文字“alpha=0.9 ”. 结果显示如图 5-1. 图 5-1 函数图形填色、标注文字等的综合应用三、 实验结论与总结 已知事件Xx的概率 F(x), 反求其中的临界值 x, 方法有两种 : 一种方法是利用通用函数计算逆
15、累积分布函数值: icdf(name,P, a1, a2, a3), 它返回分布为 name, 参数为 a1,a2,a3, 累积概率值为 P 的临界值, 这里 name 为分布函数名, 其取值见表 5-1. 另一种方法是利用专用函数-inv 计算逆累积分布函数. 常用临界值函数见表 5-2. 四、 实验习题1. 产品的某一质量指标 , 若要求 P120X2000.8, 问允许 最大是多少? 2. 一生产线生产的产品成箱包装, 每箱的重量是随机的. 假设每箱平均重 50 千克, 标准差为 5 千克 . 若用最大载重量为 5 吨的汽车承运, 试利用中心极限定理说明每辆车最多可以装多少箱, 才能保证
16、不超载的概率大于 0.977? 3某灯泡厂生产的灯泡的平均寿命原为 2000 小时, 标准差为 200 小时. 经过技术改造使其平均寿命提高到 2250 小时, 标准差不变. 现对其进行检验, 方法如下: 任意挑选若干只灯泡, 如这些灯泡的平均寿命超过 2200 小时, 就 承认技术改造有效 , 检验获得通过. 欲使检验的通过率超过 0.997, 至少应检查多少只灯泡? 4. 某公司电话总机有 200 台分机, 每台分机有 6%的时间用于外线通话, 假定每台分机用不用外线是相互独立的. 试问该总机至少应装多少条外线 , 才能有 95%的把握确保各分机需用外线时不必等候? 5. 某车间有 200
17、 台车床, 在生产期间由于需要检修、调换刀具、变换位置及调换工件等常需停车. 设开工率为 0.6, 并设每台车床的工作是独立的, 且在开工时需电力 1 千瓦. 问最少应供应多少千瓦电力就能以 99.9%的概率保证该 车间不会因供电不足而影响生产?【实验结论与总结 】计算离散型随机变量中的概率密度函数时, x 取值应该是自然数, 如果取 其它值( 非自然数!), 其概率密度函数的值为 0. 在计算逆累积分布函数时 , 输入参数 p 是概率, 应该在0,1之间, 如果超出这个范围, 求出的值为 NaN, 这 是 MATLAB 中的一个符号, 表示不是一个数(Not-a-Number). 本实验全面
18、综合了概率论的主要知识点, 要求读者应该熟练掌握和理解. 【实验习题】1. 一大楼装有 5 个同类型的供水设备. 调查表明, 在任一时刻 t 每个设备被使用的概率为 0.1. 问在同一时刻: (1) 恰有两个设备被使用的概率是多少? (2) 至少有 3 个设备被使用的概率是多少? (3) 至多有 3 个设备被使用的概率是多少? (4) 至少有 1 个设备被使用的概率是多少? 2. 有 1000 件产品, 其中 900 件是正品,其余是次品. 现从中任取 1 件,有放回地取 5次.试求这 5 件产品中所含次品数 X 的分布律. 3. 一电话总机每分钟收到呼唤的次数服从参数为 4 的泊松分布 .
19、求:(1) 每一分钟恰有 8 次呼唤的概率; (2) 某一分钟的呼唤次数大于 3 的概率. 4. 设 X N(2, 6), 求: (1)x=2 时的概率密度值; (2) 事件 X-2, X2, X18的概率,并比较实际含义; (3) 上 0.01 分位数. 5. 设 X 服从区间(2, 6)上的均匀分布, 求: (1)x=2.5 时的概率密度值; (2) 事件 X1, X3, X6的概率, 并比较实际含义; (3) 上 0.01 分位数.6.分析统计三大分布密度函数及其特点、分位数实验类别: _专 业: _班 级: _学 号: _姓 名: _中北大学理学院实验一 (黑体三号)【实验内容】1. 2. 3. 【实验方法与步骤】 (对于必须编写计算机程序的实验,要附上学生自己编写的程序)【实验结果】字体说明:标题行为黑体三号居中,其余字体均为宋体四号页面格式要求:1、纸张大小:A4 纸;2、页边距:上:3cm;下:2.5 cm;左:3cm;右 2 cm。