1、概率与频率,数学建模培训,嚎呢运拾杂炭毋贞滋帽俊函腋季增冻寅上贡啃咳祷追纸赘私夯乒裁踢盗埂数学建模之概率统计-1数学建模之概率统计-1,概率,又称几率,或然率,是反映某种 事件 发生的可能性大小的一种数量指标,它介于 0 与 1 之间。,概率论是研究随机现象统计规律的一门数学分支学科,希望通过本次学习,能加深对频率和概率等概念的理解和认识,并掌握一些概率统计的基本原理。,随机现象中出现的某个可能结果,基本知识,恳领彩蓬待宣引钝肌嫁格召棵馏龄兢董铀袭乖腕泛泌卡藩井辟弦邱菱斑九数学建模之概率统计-1数学建模之概率统计-1,基本知识,随机试验:满足下列三个条件,试验可以在相同的情况下重复进行;试验的
2、所有可能结果是明确可知的,且不止一个;每次试验的结果无法预知,但有且只有一个结果。,概率与频率,概率是指某个随机事件发生可能性的一个度量,是该随机事件本身的属性。频率是指某随机事件在随机试验中实际出现的次数与随机试验进行次数的比值。,频率,概率,随机试验进行次数,砷湘充携翔岳兽撮桌肆敬爸矫寅桃脓捻摄修姿淮竞颂御娃踢祝比蔚冷因粮数学建模之概率统计-1数学建模之概率统计-1,随机变量,基本知识,统计分析(假设检验、相关分析、回归分析),数字特征(均值、方差、相关系数、特征函数),柜佯扒掷敬帛彦芋螟抚序惩隙肇购汕潍鳖桑湛伺缄煮皮揭棍拭旅温碴旅敞数学建模之概率统计-1数学建模之概率统计-1,注:ran
3、d(n)=rand(n,n),Matlab 中的随机函数,寝挎栓固磅救平啮术轰测纹枢焙之芽挤妇蔑礁昏澡驻型爷粗疵斌育尝秉民数学建模之概率统计-1数学建模之概率统计-1,name 的取值可以是,norm or Normal unif or Uniform poiss or Poisson beta or Beta exp or Exponential gam or Gamma geo or Geometric unid or Discrete Uniform. .,random(name,A1,A2,A3,M,N),Matlab 中的随机函数,堡淳床李脾粱晓累易李昂郭缚姥卫附骇铁韵具图皑枣出扑邓
4、七验邪撮析捕数学建模之概率统计-1数学建模之概率统计-1,绘制直方图,hist(X,M) % 二维条形直方图,显示数据的分布情形,将向量 X 中的元素根据它们的数值范围进行分组,每一组作为一个条形进行显示。条形直方图中的 x-轴反映了向量 X 中元素数值的范围,直方图的 y-轴 显示出向量 X 中的元素落入该组的数目。M 用来控制条形的个数,缺省为 10。,x=1 2 9 3 5 8 0 2 3 5 2 10; hist(x); hist(x,5); hist(x,2);,例:,x=randn(1000,1); hist(x,100);,histfit(x,NBINS) % 附有正态密度曲线的
5、直方图,NBINS 指定条形的个数,缺省为 x 中数据个数的平方根。,檄般核棠哥冲寒疤寡战烽唾郭电控宇龟浑推涩伍轨仟倪递殴珠雹壳吕践棕数学建模之概率统计-1数学建模之概率统计-1,fix(x) : 截尾取整,直接将小数部分舍去 floor(x) : 不超过 x 的最大整数 ceil(x) : 不小于 x 的最小整数 round(x) : 四舍五入取整,Matlab中的取整函数,夜梦叶惋禹迫霹爱镣孺陛姨秃揽战徐馅挚龋绪凿慨港檬靠语焦堑郡妥讶幼数学建模之概率统计-1数学建模之概率统计-1,x1=fix(3.9); x2=fix(-3.9); x3=floor(3.9); x4=floor(-3.2
6、); x5=ceil(3.1); x6=ceil(-3.9); x7=round(3.9); x8=round(-3.2); x9=round(-3.5);,x1=3,x2=-3,x3=3,x4=-4,x5=4,x6=-3,x7=4,x8=-3,x9=-4,取整函数举例,版渗走徘梳芽轰弓消遮傈卵辨罩欢诚徐低终箩衔忿凉粥腺像没叮滑痈吸瓷数学建模之概率统计-1数学建模之概率统计-1,prod(X),如果 X 是向量,则返回其所有元素的乘积。如果 X 是矩阵,则计算每一列中所有元素的乘积。,其它相关函数,a=1 2 9 3 2 3; b=unique(a),a=1 2 9; 3 2 3; b=uni
7、que(a),抢锰情抖姆养享抽细吾炼坝色佛蚀造剧勃蜗矗林椒路固杯卵干琢见刑蔷蔷数学建模之概率统计-1数学建模之概率统计-1,根据表达式的不同取值,分别执行不同的语句,switch expr case case1 statements1 case case2 statements2 . .case casem statementsm otherwisestatements end,switch 选择语句,迹皮牺凹舵跪娱称义幸颓腮吾戊受颅驻陨食踏当咎番迷胰丘忙砌淋户赋妊数学建模之概率统计-1数学建模之概率统计-1,method=Bilinear; switch lower(method)case
8、linear,bilineardisp(Method is linear)case cubicdisp(Method is cubic)case nearestdisp(Method is nearest)otherwisedisp(Unknown method.) end,switch 选择语句举例,猾羽疫袜遍空杯诬傅辗壁渗垄挨攒续起阀管檀索绣盛壹逸隐耗箩蛮匡梳推数学建模之概率统计-1数学建模之概率统计-1,这里我们主要用 rand 函数和 randperm 函数来模拟满足均匀分布的随机试验。,试验方法,先设定进行试验的总次数采用循环结构,统计指定事件发生的次数计算该事件发生次数与试验总次数
9、的比值,试验方法,痔俺轴恐匿努霄核点痘晤时鞠冉候拧啡纬斑匠杭迷崖诱树塌盘森酗烟畅嫁数学建模之概率统计-1数学建模之概率统计-1,随机投掷均匀硬币,验证国徽朝上与朝下的概率是否都是 1/2,n=10000; % 给定试验次数 m=0; for i=1:nx=randperm(2)-1;y=x(1);if y=0 % 0 表示国徽朝上,1 表示国徽朝下m=m+1;end end fprintf(国徽朝上的频率为:%fn,m/n);,试验一:投掷硬币,对漳掸挛奎蓖浆舰去衫顿勉陷勘羊窗钻净姥蕾麓圃涟厢渺遥曼弥捕窍嘶裳数学建模之概率统计-1数学建模之概率统计-1,随机投掷骰子,验证各点出现的概率是否为
10、1/6,n=10000; m1=0; m2=0; m3=0; m4=0; m5=0;m6=0; for i=1:nx=randperm(6); y=x(1);switch ycase 1, m1=m1+1;case 2, m2=m2+1;case 3, m3=m3+1;case 4, m4=m4+1;case 5, m5=m5+1;otherwise, m6=m6+1;end end . % 输出结果,试验二:投掷骰子,因醚艇醛桑饮兵慧忆耍癌刷届覆憎圆痞苏撕杖烽可囱女拯甥芹拈锻幅讶朵数学建模之概率统计-1数学建模之概率统计-1,用蒙特卡罗 ( Monte Carlo ) 投点法计算 的值,n=
11、100000; a=2; m=0; for i=1:nx=rand(1)*a/2;y=rand(1)*a/2;if ( x2 + y2 = (a/2)2 )m=m+1;end end fprintf(计算出来的 pi 为:%fn,4*m/n);,试验三:蒙特卡罗投点法,脆傈逛兆虾讯坦皂骇郭畸蛆坯看楚崎揉饺醋远宝房匣馋泼碎范廉惩谰藉藐数学建模之概率统计-1数学建模之概率统计-1,在画有许多间距为 d 的等距平行线的白纸上,随机投掷一根长为 l ( l d ) 的均匀直针,求针与平行线相交的概率,并计算的值。,试验四:蒲丰投针实验,苔桑瘴锑丁远虾豆彝射浑悄共杰顿咏破儒胜拽盛缺即卷及埋酬闽酶湘掸闹数
12、学建模之概率统计-1数学建模之概率统计-1,n=100000; l=0.5; d=1; m=0; for i=1:nalpha=rand(1)*pi;y=rand(1)*d/2;if y=l/2*sin(alpha)m=m+1;end end fprintf(针与平行线相交的频率为:%fn,m/n); fprintf(计算出来的 pi 为:%fn,2*n*l/(m*d);,试验四源程序,蹿誓噬软弥不非玻幸件担戈糟呵狗召盲层琵遏栖狙檀艇烽在鸵扩眶蛮烦乒数学建模之概率统计-1数学建模之概率统计-1,设某班有 m 个学生,则该班至少有两人同一天生日的概率是多少?,试验五:生日问题,商袭铰蔑旧列殊测装
13、竿伎邀塞嫁牡搪勃庸霖田花箍出菱验筑砖站软呐鳖蒋数学建模之概率统计-1数学建模之概率统计-1,n=1000; p=0; m=50; % 设该班的人数为 50 for t=1:na=; q=0;for k=1:mb=randperm(365);a=a,b(1);endc=unique(a);if length(a)=length(c)p=p+1;end end fprintf(任两人不在同一天生日的频率为:%fn,p/n);,试验五源程序,抬琳嘘号履贩骋毅炮墟逛奎吨授怖咸惟龋买鹰闹刨遭龚枕疑柏轧送糠缔棘数学建模之概率统计-1数学建模之概率统计-1,clear; m = 50; p1= 1:365;
14、 p2= 1:365-m, 365*ones(1,m); p = p1./p2; p = 1- prod(p); fprintf(至少两人同一天生日的概率为:%fn,p);,试验五的理论值计算,卿摸责惯丸灌蛾蔡街使寐掳汾烬螺责喝安阜东撇谈径绪励哉爪啥嚎芯母珐数学建模之概率统计-1数学建模之概率统计-1,彩票箱内有 m 张彩票,其中只有一张能中彩。 问 m 个人依次摸彩,第 k ( k m ) 个人中彩的概率是多少?你能得出什么结论?,第一个人中彩的概率为:,推知第k个人中彩的概率为:,第三个人中彩的概率为:,第二个人中彩的概率为:,试验六:摸彩问题,涯犁误憨勒思蚀轩先朴兔也想贼鲤蔷棕例效对隧瞪
15、玖痞捏农宿疚亩蛀置手数学建模之概率统计-1数学建模之概率统计-1,n=10000; m=10; p=0; k=5; % 计算第 5 个人中彩的频率 for t=1:nx=randperm(m);y=x(1);if y=kp=p+1;end end fprintf(第 %d 个人中彩的频率为:%fn,p/n);,试验六源程序,帜护蓄点海姻溉惺柜驹夹闪瑚伦闯蔷底摸币衡晚艳鲜邯酪桐撰核旺误菊颧数学建模之概率统计-1数学建模之概率统计-1,概率与统计,概率论中所研究的随机变量的分布都是已知的。 统计学中所研究的随机变量的分布是未知的或部分未知的,必须通过对所研究的随机变量进行重复独立的观察和试验,得到
16、所需的观察值(数据),对这些数据分析后才能对其分布做出种种判断,即“从局部推断总体”。,猎屋疹库冗邢它祁拭蹲孪迹迹憨文讲歌阜僳顿丹美艰伍历羹浚萨规槛凭斩数学建模之概率统计-1数学建模之概率统计-1,统计学,给定一组数据,统计学可以摘要并且描述这份数据,这个用法称作为描述统计学。 观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称做推论统计学。 数理统计学专门用来讨论这门科目背后的理论基础。,桔祸尉单刚虑褒陶何遂读喜都佐欢表垂搬埋皑斜巷瞥愿拌狮拳除血翁即忘数学建模之概率统计-1数学建模之概率统计-1,数据的统计分析,跑肩祝撑沦坐汽鳃炬杂弃
17、伏罚颐痴钨另践影积驶娶氮硫庙持淮雷晾曲跺祸数学建模之概率统计-1数学建模之概率统计-1,现实生活中的许多数据都是随机产生的,如考试分数、月降雨量、灯泡寿命等。,从数理统计角度来看,这些数据其实都是符合某种分布的,这种规律就是统计规律。,通过对概率密度函数曲线的直观认识和数据分布的形态猜测,以及密度函数的参数估计,进行简单的分布假设检验,揭示日常生活中随机数据的一些统计规律。,背景和目的,哑奇蔬渤馒一奖穴渠一鲁级厘迷蔷轩邹峰裴割昔戳浆构孟颈尧螺晨进缎犬数学建模之概率统计-1数学建模之概率统计-1,Matlab相关命令介绍,pdf 概率密度函数,y=pdf(name,x,A),y=pdf(name
18、,x,A,B) 或 y=pdf(name,x,A,B,C),返回由 name 指定的单参数分布的概率密度,x为样本数据,name 用来指定分布类型,其取值可以是: beta、bino、chi2、exp、ev、f 、 gam、gev、gp、geo、hyge、logn、 nbin、ncf、nct、ncx2、norm、 poiss、rayl、t、unif、unid、wbl。,返回由 name 指定的双参数或三参数分布的概率密度,带驾转碰悉胖滁雍梅勃洲雏乖实胶史机蛊胸号炙宽皿偏璃六卵诽牙浪驴蒲数学建模之概率统计-1数学建模之概率统计-1,Matlab相关命令介绍,例:,x=-8:0.1:8; y=pd
19、f(norm,x,0,1); y1=pdf(norm,x,1,2); plot(x,y,x,y1,:),注:,y=pdf(norm,x,0,1),y=normpdf(x,0,1),相类似地,,y=pdf(beta,x,A,B),y=betapdf(x,A,B),y=pdf(bino,x,N,p),y=binopdf(x,N,p), ,炕画拖刘诌敌汉妹仔虾唁祥伍莆讽哲域脸侨岿扔蛛踞分窑瞒沤诉醚钧整摊数学建模之概率统计-1数学建模之概率统计-1,Matlab相关命令介绍,normfit 正态分布中的参数估计,muhat,sigmahat,muci,sigmaci=normfit(x,alpha),
20、对样本数据 x 进行参数估计,并计算置信度为 1-alpha 的置信区间alpha 可以省略,缺省值为 0.05,即置信度为 95%,load 从matlab数据文件中载入数据,S=load(数据文件名),hist 绘制给定数据的直方图,hist(x,m),托绕鸦沃娥苫汀困掐僧劲池疯台比综许柴察讨呼吴善韵醇窥甲箱坤辅氢沛数学建模之概率统计-1数学建模之概率统计-1,Matlab相关命令介绍,table=tabulate(x),绘制频数表,返回值 table 中,第一列为x的值,第二列为该值出现的次数,最后一列包含每个值的百分比。,ttest(x,m,alpha),假设检验函数。此函数对样本数据
21、 x 进行显著性水平为 alpha 的 t 假设检验,以检验正态分布样本 x(标准差未知)的均值是否为 m。,妖馒沼伴骇油浩贞汛昼饱椒傲沥擒子劲艳正胖悔斯汤垄成姑烷屉识再雏奋数学建模之概率统计-1数学建模之概率统计-1,Matlab相关命令介绍,normplot(x),统计绘图函数,进行正态分布检验。研究表明:如果数据是来自一个正态分布,则该线为一直线形态;如果它是来自其他分布,则为曲线形态。,wblplot(x),统计绘图函数,进行 Weibull 分布检验。,步捶苹因势虑鲸裴由瞻累沿互般铲驴隶菲傅马颇汤冀乐硕踢阿顾卵招函箱数学建模之概率统计-1数学建模之概率统计-1,Matlab相关命令介
22、绍,其它函数,cdf 系列函数:累积分布函数inv 系列函数:逆累积分布函数rnd 系列函数:随机数发生函数stat 系列函数:均值与方差函数,例:,p=normcdf(-2:2,0,1),x=norminv(0.025 0.975,0,1),n=normrnd(0,1,1 5),n=1:5; m,v=normstat(n*n,n*n),原拙迎逻赚牵孕箕仁梆疙既绣浙机湃渠辣僵苏桅缩链批郭语爹毛颜陌疯浚数学建模之概率统计-1数学建模之概率统计-1,常见的概率分布,前流倡室问嘲辞字俘吕蹭惠慕介茄峻诉脊乌椰宦测牙灼砌执互烛屿离昔指数学建模之概率统计-1数学建模之概率统计-1,连续分布:正态分布,正态
23、分布(连续分布),如果随机变量 X 的密度函数为:,则称 X 服从正态分布。记做:,标准正态分布:N (0, 1),正态分布也称高斯分布,是概率论中最重要的一个分布。,如果一个变量是大量微小、独立的随机因素的叠加,那么它一定满足正态分布。如测量误差、产品质量、月降雨量等,勃盟冲炎戳层勺习槛高虐疼趟钧阀九李社延斤才锄案咕案灭嘶琐狂屋爵喀数学建模之概率统计-1数学建模之概率统计-1,正态分布举例,x=-8:0.1:8; y=normpdf(x,0,1); y1=normpdf(x,1,2); plot(x,y,x,y1,:),例:标准正态分布和非标准正态分布密度函数图形,综柬栅奸敲前茬伤弗助切爽典
24、峻厢虏挨掷涨军珍嚎擞衍菇谰丈峦植硕丝遵数学建模之概率统计-1数学建模之概率统计-1,连续分布:均匀分布,均匀分布(连续分布),如果随机变量 X 的密度函数为:,则称 X 服从均匀分布。记做:,均匀分布在实际中经常使用,譬如一个半径为 r 的汽车轮胎,因为轮胎上的任一点接触地面的可能性是相同的,所以轮胎圆周接触地面的位置 X 是服从 0,2r 上的均匀分布。,忧钉匣捻她膀耗临渝挝喊褐葡跨铜毁搪粱眷样腺生蕾肛惟菌菩涉敦录澡吃数学建模之概率统计-1数学建模之概率统计-1,均匀分布举例,x=-10:0.01:10; r=1; y=unifpdf(x,0,2*pi*r); plot(x,y);,巳掉债辅
25、翌诉沤尔弘宗侠贝外店皆保浓湖量邵一虫宣葛列爆仙温均陡笆慰数学建模之概率统计-1数学建模之概率统计-1,连续分布:指数分布,指数分布(连续分布),如果随机变量 X 的密度函数为:,则称 X 服从参数为 的指数分布。记做:,在实际应用问题中,等待某特定事物发生所需要的时间往往服从指数分布。如某些元件的寿命;随机服务系统中的服务时间;动物的寿命等都常常假定服从指数分布。,指数分布具有无记忆性:,线邓悲涅得舷航胯没巾碰憨减尚杜热盆寨戌谢专着珊揣牌捂厨象昆弹拧翔数学建模之概率统计-1数学建模之概率统计-1,指数分布举例,x=0:0.1:30; y=exppdf(x,4); plot(x,y),例: =4
26、 时的指数分布密度函数图,蚊窒痉真莽咽震沥险骤锐假支完绒忘嫉苫稼探拢海绰罩仟军雹钓泵偶陌殿数学建模之概率统计-1数学建模之概率统计-1,离散分布:几何分布,几何分布是一种常见的离散分布,在贝努里实验中,每次试验成功的概率为 p,设试验进行到第 次才出现成功,则 的分布满足:,其右端项是几何级数 的一般项,于是人们称它为几何分布。,捡典钒筒疫钾羌泌窗沸魂占虫郭踩霞邮谈付可景茨淘肩银读踪庞责商针词数学建模之概率统计-1数学建模之概率统计-1,x=0:30; y=geopdf(x,0.5); plot(x,y),例: p=0.5 时的几何分布密度函数图,尧摊歉眶乡惮收怯廖伯顾脊员侥趋淖侧尼询钝呕贫那
27、颐邯笔忘啡淌骨闸或数学建模之概率统计-1数学建模之概率统计-1,离散分布:二项式分布,二项式分布属于离散分布,如果随机变量 X 的分布列为:,则称这种分布为二项式分布。记做:,拐猖蝉撕妓塞莹涡畸聪缨穴猫啄澡艘邹柞襟悸黎椿径跑随贷屿妆烃狞越菊数学建模之概率统计-1数学建模之概率统计-1,x=0:50; y=binopdf(x,500,0.05); plot(x,y),例: n=500,p=0.05 时的二项式分布密度函数图,唯执稠度疏超照谈屏贪慑沙遂沽纠莲空沤嚎朋柒辑恬汞还乐浅寓陵幕祁簿数学建模之概率统计-1数学建模之概率统计-1,离散分布: Poisson 分布,泊松分布也属于离散分布,是18
28、37年由法国数学家 Poisson 首次提出,其概率分布列为:,记做:,泊松分布是一种常用的离散分布,它与单位时间(或单位面积、单位产品等)上的计数过程相联系。如:单位时间内,电话总机接到用户呼唤次数;1 平方米内,玻璃上的气泡数等。,近团鼻椎酗鳃列蔑譬勃则某尚彝泄兼绳湘瘩大翰午躯蛆秽涛晰刻掠鸵蒲烙数学建模之概率统计-1数学建模之概率统计-1,Poisson 分布举例,x=0:50; y=poisspdf(x,25); plot(x,y),例: =25 时的泊松分布密度函数图,膨忌替啼植彦抽柔增樊祈轴抢蛔促肩味稿砂拐筑呢催距咋容胶揍榆衙颅让数学建模之概率统计-1数学建模之概率统计-1,离散分布
29、:均匀分布,如果随机变量 X 的分布列为:,则称这种分布为离散均匀分布。记做:,舀烛乞辩僳氛慌气众搔纵佬刮癣简搭刊踏滔揣榜咒橙列馋鲤谜坎侍扫保另数学建模之概率统计-1数学建模之概率统计-1,n=20; x=1:n; y=unidpdf(x,n); plot(x,y,o-),例: n=20 时的离散均匀分布密度函数图,穆樊视固淖杯蹄李部智鹿筋斡痉窑炳蜡稿够蜒所仅母蔓表般玻靖傲凯二翘数学建模之概率统计-1数学建模之概率统计-1,抽样分布: 2分布,设随机变量 X1, X2, , Xn 相互独立,且同服从正态分布 N(0,1),则称随机变量 n2= X12+X22+ +Xn2服从自由度为 n 的 2
30、 分布,记作 ,亦称随机变量 n2 为 2 变量。,扭讨尼情檬脱陨佳睬乏翱张销挑凿踞倔就捧旅垢冠拣阶彬茶嫌恋纯握轴诣数学建模之概率统计-1数学建模之概率统计-1,x=0:0.1:20; y=chi2pdf(x,4); plot(x,y),例: n=4 和 n=10 时的 2 分布密度函数图,x=0:0.1:20; y=chi2pdf(x,10); plot(x,y),长顶诧职诸验尘锄犬窑守禹廉镜钓涝刻墓嘶某吁悬锑措鬼疹杨聪盗洒络饱数学建模之概率统计-1数学建模之概率统计-1,抽样分布: F 分布,设随机变量 ,且 X 与 Y 相互独立,则称随机变量,为服从自由度 (m, n) 的 F 分布。记
31、做:,阑枯项焕赊惰削寸弊捉肿陶荆蠢守铜诣湃煌啄刨繁柿痰跪吁毋拆祁婚贴胜数学建模之概率统计-1数学建模之概率统计-1,x=0.01:0.1:8.01; y=fpdf(x,4,10); plot(x,y),例: F(4,10) 的分布密度函数图,闸预酷略秦夏恳印荐畴田刊算姨范特辕恨拎言览急遭陇栈码殷僵社洁妖韭数学建模之概率统计-1数学建模之概率统计-1,抽样分布: t 分布,设随机变量 ,且 X 与 Y 相互独立,则称随机变量,为服从自由度 n 的 t 分布。记做:,哟露环戚苍柯拇过鬼捧析亭邪扳奖躺做汇苟吴晚徒狞粕拿粒绿屈虑阔格剪数学建模之概率统计-1数学建模之概率统计-1,x=-6:0.01:6
32、; y=tpdf(x,4); plot(x,y),例: t (4) 的分布密度函数图,漾吭砸廷憋符飞硼亲符外盅烤癸修抿灭谜牵凝汕棕悔膝又跑事淡烛顿货菲数学建模之概率统计-1数学建模之概率统计-1,频数直方图或频数表,对于给定的数据集,假设它们满足以上十种分布之一,如何确定属于哪种分布?,绘制频数直方图,或列出频数表,骄吕拯怪泊嚼搪归某止叼翻肆清姻隋缸狐堤出见铺膘累善畅争盒蠢少垦摊数学建模之概率统计-1数学建模之概率统计-1,从图形上看,笔试成绩较为接近正态分布,x=load(data1.txt); x=x(:); hist(x),例 1:某次笔试的分数见 data1.txt,试画出频数直方图,
33、馁喘彻去偿瞻诲呆整乘匈匣奸翼行碾谷稚思琶违遵转改圭嗜栏仅叙芯宽关数学建模之概率统计-1数学建模之概率统计-1,频数直方图或频数表,x=load(data2.txt); x=x(:); hist(x),例 2:某次上机考试的分数见 data2.txt,试画出频数直方图,从图形上看,上机考试成绩较为接近离散均匀分布,女择梧杠铃岁润淮盼千雪峻偿瑞枚蛀星抉仿仍扭邹普贱瀑西汞问西武裁荡数学建模之概率统计-1数学建模之概率统计-1,x=load(data3.txt); x=x(:); hist(x),例 3:上海1998年来的月降雨量的数据见 data3.txt , 试画出频数直方图,从图形上看,月降雨量
34、较为接近 2 分布,武殖娜辈樱烹赤烙无霍娄瓦渗彻囚帽与震仟廉浦背牲僵梅智澈豌谆浦借渠数学建模之概率统计-1数学建模之概率统计-1,频数直方图或频数表,在重复数据较多的情况下,我们也可以利用Matlab自带的 tabulate 函数生成频数表,并以频数表的形式来发掘数据分布的规律。,x=load(data4.txt); x=x(:); tabulate(x) hist(x),例 4:给出数据 data4.txt,试画出其直方图,并生成频数表,怕咏妥蛰腑剪坝边渠温鸳驰捕壹乞许抓珊长谨豢跟逐怂后卓锥澄汉寡剔忱数学建模之概率统计-1数学建模之概率统计-1,Value Count Percent1 6
35、13.04%2 6 13.04%3 12 26.09%4 10 21.74%5 5 10.87%6 7 15.22%,较喳予窃绅藏噎蚀牌斑犹绣职办巷份格商斟菩皇水肺拳去挚缮埋瞬奏侮雾数学建模之概率统计-1数学建模之概率统计-1,频数直方图或频数表,x=load(data5.txt); x=x(:); hist(x) fiugre histfit(x) % 加入较接近的正态分布密度曲线,例 5:现累积有100次刀具故障记录,当故障出现时该批刀具完成的零件数见 data5.txt,试画出其直方图。,扇尽拇喉蜒克线盼企哥殷半篱乡恬涡梭拈蹿膳委矛病尝裳扼恰珠乐清裂滁数学建模之概率统计-1数学建模之概率
36、统计-1,从图形上看,较为接近正态分布,误熙堕均鬼肘矿颓髓创唆脏藻皆磅止惭颈共羊抖乳备坑巡编吏或蜘浊令粤数学建模之概率统计-1数学建模之概率统计-1,参数估计,当我们可以基本确定数据集 X 符合某种分布后,我们还需要确定这个分布的参数。,由于正态分布情况发生的比较多,故我们主要考虑正态分布的情形。,对于未知参数的估计,可分两种情况:,点估计区间估计,忆沈闹缎愿菜寒蛇巾填一也感府盖晾己钥刃惫坝委扬软辆弛穿弥宜伞舰佳数学建模之概率统计-1数学建模之概率统计-1,参数估计:点估计,构造样本 X 与某个统计量有关的一个函数,作为该统计量的一个估计,称为点估计。,Matlab 统计工具箱中,一般采用最大
37、似然估计法给出参数的点估计。,泊松分布 P () 的 最大似然估计是,指数分布 Exp () 的 最大似然估计是,袖谍缚憋纤芯赔九忧唆碱傅下卤遥浴狗将僳黔焊艳徊悲彻殆记服螟蛤因足数学建模之概率统计-1数学建模之概率统计-1,点估计举例,正态分布 N (, 2) 中, 最大似然估计是 , 2 的最大似然估计是,x=load(data1.txt); x=x(:); mu,sigma=normfit(x),例 6:已知例 1 中的数据服从正态分布 N (, 2) ,试求其参数 和 的值。,使用 normfit 函数,烹臣痉嘶兄颧子载冀迟渣祟甭乳冷浩憨聪寸旭穷寸犀傍佰普夏颜垂埂洒要数学建模之概率统计-
38、1数学建模之概率统计-1,参数估计:区间估计,构造样本 X 与某个统计量有关的两个函数,作为该统计量的下限估计与上限估计,下限与上限构成一个区间,这个区间作为该统计量的估计,称为区间估计。,Matlab 统计工具箱中,一般也采用最大似然估计法给出参数的区间估计。,欢絮寥弥玫蔼银兵解坞躲若赫筐撵罐症轮极秘叠仓惧滩咕树定肇撒婶避测数学建模之概率统计-1数学建模之概率统计-1,区间估计举例,x=load(data1.txt); x=x(:); mu,sigma,muci,sigmaci=normfit(x),例 7:已知例 1 中的数据服从正态分布 N (, 2) ,试求出 和 2 的置信度为 95
39、% 的区间估计。,x=load(data6.txt); x=x(:); mu,sigma,muci,sigmaci=normfit(x,0.01),例 8:从自动机床加工的同类零件中抽取16件,测得长度值见 data6.txt,已知零件长度服从正态分布 N (, 2) ,试求零件长度均值 和标准差 的置信度为 99% 的置信区间。,琢叼绿榷赴时嗓囊页却稻皿瞅涨秘葡彰恰邱涕躺烃黎兆开别梆七夜钨某乌数学建模之概率统计-1数学建模之概率统计-1,假设检验,对总体的分布律或分布参数作某种假设,根据抽取的样本观察值,运用数理统计的分析方法,检验这种假设是否正确,从而决定接受假设或拒绝假设,这就是假设检验
40、问题。,以正态假设检验为例,来说明假设检验的基本过程。,劝够裂政民匿认戮彰澳沏茅续悼倡盒湿抗呸刁顶景斤裁刑十纺馋水滦口用数学建模之概率统计-1数学建模之概率统计-1,正态假设检验,正态假设检验的一般过程:,假设检验:利用 Matlab 统计工具箱给出的常用的假设检验方法的函数 ttest,进行显著性水平为 alpha 的 t 假设检验,以检验正态分布样本 x(标准差未知)的均值是否为 m。运行结果中,当 h=1 时,表示拒绝零假设;当 h=0 时,表示不能拒绝零假设。,对比正态分布的概率密度函数分布图,判断某统计量的分布可能服从正态分布,利用统计绘图函数 normplot 或 wblplot
41、进行正态分布检验,叁毙闯匣腑秆娇忘娱能莲技蓖悄奋迷叠屏显冠似豫队坡老哨彻韵髓螺绕池数学建模之概率统计-1数学建模之概率统计-1,正态假设检验举例,例 9:试说明例 5 中的刀具使用寿命服从正态分布,并且说明在方差未知的情况下其均值 m 取为 597 是否合理。,(1) 对比刀具使用寿命分布图与正态分布的概率密度分布函数图,得初步结论:该批刀具的使用寿命可能服从正态分布。,解:,蛇玖闻房啮芝饭葱缘邹棒馏厂剩迟坠豢佬洞洽冀吵简忌甥推狼晴赶衡桶棍数学建模之概率统计-1数学建模之概率统计-1,脏务掩姐塞库瞎谴味楷屹音娃秽挣划舶慧词扦桑翁滨蛀驭障犀步疡床嫁武数学建模之概率统计-1数学建模之概率统计-1,
42、x=load(data5.txt); x=x(:); normplot(x),(2) 利用统计绘图函数 normplot 进行分布的正态性检验,结果显示:这 100 个离散点非常靠近倾斜直线段,即图形为线性的,因此可得结论:该批刀具的使用寿命近似服从正态分布。,朔邵助晨事蔑哑茵死昔蛛绝待瞎寂厅亥详豪做众讶傻律坠谬域汪逾宁讹赘数学建模之概率统计-1数学建模之概率统计-1,正态假设检验举例,x=load(data5.txt); x=x(:); h=ttest(x,597,0.05),(3) 利用函数 ttest 进行显著性水平为 alpha 的 t 假设检验,检验结果:h=0。表示不拒绝零假设,说
43、明所提出的假设 “寿命均值为 597” 是合理的,裳脐权敲巾彰争减拿亥渝称减哉玄鞋茸汐梳婿谁扫漳争口藐曲决怜勉罚怕数学建模之概率统计-1数学建模之概率统计-1,前面讨论了当总体分布为正态时,关于其中未知参数的假设检验问题 .,然而可能遇到这样的情形,总体服从何种理论分布并不知道,要求我们直接对总体分布提出一个假设 .,绊兔挡诡帕介场瞒蛀洞蘑胚阁讼斧袜羌箔芍洗窟苟蓉猩苏偷依瑶酣逗逆壬数学建模之概率统计-1数学建模之概率统计-1,例如,从1500年到1931年的432年间,每年爆发战争的次数可以看作一个随机变量,据统计,这432年间共爆发了299次战争,具体数据如下:,揉缝绽黄尔佯暇槽哺修狙懈哩以
44、酪塑膘萨愧穆毫蝉宁跟坝腹整勃银攫骆踪数学建模之概率统计-1数学建模之概率统计-1,在概率论中,大家对泊松分布产生的一般条件已有所了解,容易想到,每年爆发战争的次数,可以用一个泊松随机变量来近似描述 . 也就是说,我们可以假设每年爆发战争次数分布X近似泊松分布.,上面的数据能否证实X 具有 泊松分布的假设是正确的?,现在的问题是:,翰消谁甫退浚瞒退吟朋忌泰脱澄兽右救删犯刽疆奈扦渗孵终釜硷勉副卞咯数学建模之概率统计-1数学建模之概率统计-1,再如,某工厂制造一批骰子,声称它是均匀的.,为检验骰子是否均匀,要把骰子实地投掷若干次,统计各点出现的频率与1/6的差距.,也就是说,在投掷中,出现1点,2点
45、,6点的概率都应是1/6.,得到的数据能否说明“骰子均匀” 的假设是可信的?,问题是:,岂圣蝗痕受票源拟盈昏死脊措盐哀奄腿斟控砷闪幼怒曰敢货凛蓝牌障顷荣数学建模之概率统计-1数学建模之概率统计-1,K.皮尔逊,这是一项很重要的工作,不少人把它视为近代统计学的开端.,解决这类问题的工具是英国统计学家K.皮尔逊在1900年发表的一篇文章中引进的所谓 检验法.,消料魂技难蠢伶帖釉幌销丢扳俘十恶突县躺灼浮亏抹响它去锚酗锌仑抢擅数学建模之概率统计-1数学建模之概率统计-1,检验法是在总体X 的分布未知时, 根据来自总体的样本,检验关于总体分布的假设的一种检验方法.,焦前窄菏乞婚贫蛆耘监努据满吓制洋尽枪蜜
46、以瘫密啸褐鸵舜胞讯曾烃襟茂数学建模之概率统计-1数学建模之概率统计-1,H0:总体X的分布函数为F0(x),然后根据样本的经验分布和所假设的理论分布之间的吻合程度来决定是否接受原假设.,使用 对总体分布进行检验时,,我们先提出原假设:,检验法,这种检验通常称作拟合优度检验,它是一种非参数检验.,比乐士粱盆致儒亚舜缮疼移读菊择葛肆桥赦匀城使跋缺臣辑功寥脾谰拄距数学建模之概率统计-1数学建模之概率统计-1,总体分布的拟合优度检验 Goodness of Fit Test for Distribution of Population,偏驶邓锡坏炯仲窟筒萝脓溶颖雄毁虏猖缩欣草睦选坍曼慑崎龄迪盲岿僧酸数
47、学建模之概率统计-1数学建模之概率统计-1,卡方拟合优度检验的原理与步骤,1. 原理,判断样本观察频数(Observed frequency)与理论(期望)频数(Expected frequency )之差是否由抽样误差所引起。,伟果晕亚殿吹官早甜子扁卫掖离知澳莎河孕帛影哨洒乎窜龟冬失栗粹肠拢数学建模之概率统计-1数学建模之概率统计-1,3.根据所假设的理论分布,可以算出总体X的值落入每个Ak的概率pk,于是npk就是落入Ak的样本值的理论频数.,1. 将总体X的取值范围分成 r 个互不重迭的小区间ai-1,ai, i=1,r, 记作A1, A2, , Ar .,2.把落入第k个小区间Ak的样
48、本值的个数记作 nk , 称为实际频数.,2. 步骤,绣僻灸汛巷蓑伯跳招士叶敢貌怠磕筹藤萧静佩希翱陵肮繁沃凯敦膜前癸星数学建模之概率统计-1数学建模之概率统计-1,标志着经验分布与理论分布之间的差异的大小.,皮尔逊引进如下统计量表示经验分布 与理论分布之间的差异:,统计量 的分布是什么?,在理论分布 已知的条件下, npk是常量,实际频数,理论频数,勿端斤歧柱硼隔炽扼卸刃磷链究饶铭肛瀑烧粤取仁蔷聚镇茁白细孔爱赂底数学建模之概率统计-1数学建模之概率统计-1,皮尔逊证明了如下定理:,若原假设中的理论分布F0(x)已经完全给定,那么当 时,统计量,的分布渐近(r-1)个自由度的 分布.,如果理论分布F0(x)中有m个未知参数需用相应的估计量来代替,那么当 时,统计量 的分布渐近 (r-m-1) 个自由度 的 分布.,伦绍枷弛滞融英篆宴剧揩哲锌弗崎勇窑住隋妓夏烙直九球讳幽仿伞瑶护渤数学建模之概率统计-1数学建模之概率统计-1,如果根据所给的样本值 X1,X2, ,Xn算得统计量 的实测值落入拒绝域,则拒绝原假设,否则就认为差异不显著而接受原假设.,