1、数理统计实验,实验四 分布拟合检验,【实验目的】 会用MATLAB进行拟合优度非参数检验 【实验要求】 熟悉MATLAB进行假设检验的基本命令与操作,【实验内容】,一、正态分布的检验 1)用编程检验服从正态分布 2)小样本正态分布的检验:lillietest 3)大样本正态分布的检验:jbtest 二、一般分布的检验 单样本K-S检验方法 1)指数分布的检验 2)泊松分布的检验(对离散型不适合) 双样本K-S检验:kstest2 三、列联表的独立性检验 四、卡方拟合优度检验 五、正态概率纸的构造原理,一、正态分布的检验,1)用编程检验服从正态分布 2)小样本正态分布的检验:lillietest
2、 3)大样本正态分布的检验:jbtest,例 下面列出了84 个伊特拉斯坎(Etruscan)人男子的头颅的最大宽度(mm),试检验这些数据是否来自正态总体(取 = 0.1)。 141 148 132 138 154 142 150 146 155 158 150 140 147 148 144 150 149 145 149 158 143 141 144 144 126 140 144 142 141 140 145 135 147 146 141 136 140 146 142 137 148 154 137 139 143 140 131 143 141 149 148 135 148
3、 152 143 144 141 143 147 146 150 132 142 142 143 153 149 146 149 138 142 149 142 137 134 144 146 147 140 142 140 137 152 145,1)用编程检验服从正态分布,解 编写Matlab程序如下: clc x=141 148 132 138 154 142 150 146 155 158 . 150 140 147 148 144 150 149 145 149 158 . 143 141 144 144 126 140 144 142 141 140 . 145 135 147 1
4、46 141 136 140 146 142 137 . 148 154 137 139 143 140 131 143 141 149 . 148 135 148 152 143 144 141 143 147 146 . 150 132 142 142 143 153 149 146 149 138 . 142 149 142 137 134 144 146 147 140 142 . 140 137 152 145;,min(x),max(x) %求数据中的最小数和最大数 hist(x,8) %画直方图 fi=length(find(x=135&x=138&x=142&x=146&x=1
5、50&x=152) %各区间上出现的频率 mu=mean(x),sigma=std(x) %均值和标准差 fendian=135,138,142,146,150,152 %区间的分点 p0=normcdf(fendian,mu,sigma) %分点处分布函数的值 p1=diff(p0) %中间各区间的概率 p=p0(1),p1,1-p0(6) %所有区间的概率 chi=(fi-84*p).2./(84*p) chisum=sum(chi) %皮尔逊统计量的值 x_a=chi2inv(0.9,4) %chi2分布的0.9分位数,运行结果: ans = 126 ans = 158 fi =5 7
6、16 23 21 7 8 mu = 143.7738 sigma = 5.9705 fendian = 135 138 142 146 150 152 p0 = 0.0708 0.1668 0.3832 0.6454 0.8515 0.9159p1 = 0.0959 0.2164 0.2622 0.2061 0.0644 p = 0.0708 0.0959 0.2164 0.2622 0.2061 0.0644 0.0841 chi =0.1520 0.1386 0.2616 0.0433 0.7851 0.4685 0.1232 chisum =1.9723 x_a = 7.7794,求得皮
7、尔逊统计量chisum=1.9723, 0.1 2(7-2-1)= 0.1 2(4) =7.7794, 故在水平0.1下接受 H0 ,即认为数据来自正态分布总体。,例1 某工厂生产一种黄金饰品,现随机抽取20件该饰品,测得每件含黄金量如下:0.693 0.749 0.654 0.670 0.662 0.672 0.615 0.606 0.690 0.628 0.668 0.611 0.606 0.609 0.601 0.553 0.570 0.844 0.576 0.933试检验这些黄金饰品的含量是否服从正态分布? Alpha=0.05,2)小样本正态分布的检验:lillietest,程序如下
8、:,X=0.693 0.749 0.654 0.670 0.662 . 0.672 0.615 0.606 0.690 0.628 . 0.668 0.611 0.606 0.609 0.601 . 0.553 0.570 0.844 0.576 0.933; H,P,LSTAT,CV=lillietest(X) 运行结果: H =1 %拒绝原假设,认为上面的数据不服从正态分布 P =0.0279 %小于0.05 LSTAT =0.2127 %测试值大于临界值 CV =0.1900,例2 随机抽查某校100名男生并测得身高数据(单位:cm) 172 183 168 176 166 174 17
9、2 174 167 169 168 171 171 181 175 170 172 178 181 164 173 184 171 180 170 183 168 181 178 171 176 178 178 175 171 184 169 171 174 178 173 175 182 168 169 172 179 172 171 187 173 177 168 176 165 172 182 175 185 191 169 175 174 175 182 183 169 182 170 180 178 172 169 185 171 176 169 172 184 183 174 17
10、8 179 172 172 173 166 175 165 182 173 174 159 176 182 179 183 167 180 166 可否认为总体服从正态分布吗?Alpha=0.05 并求出总体均值和方差的点估计。,3)大样本正态分布的检验:jbtest,程序如下:,X=172 183 168 176 166 174 172 174 167 169 .168 171 171 181 175 170 172 178 181 164 .173 184 171 180 170 183 168 181 178 171 .176 178 178 175 171 184 169 171 17
11、4 178 .173 175 182 168 169 172 179 172 171 187 .173 177 168 176 165 172 182 175 185 191 .169 175 174 175 182 183 169 182 170 180 .178 172 169 185 171 176 169 172 184 183 .174 178 179 172 172 173 166 175 165 182 .173 174 159 176 182 179 183 167 180 166; normplot(X) %用概率纸检验数据是否服从正态分布 H,P,JBSTAT,CV=jbt
12、est(X,0.05) %正态分布的拟合检验,运行结果:,H =0 接收原假设 P=0.5012 接收原假设的概率 JBSTAT =1.3816 测试值 CV = 5.9915 临界值 测试值1.3816小于临界值5.9915,所以接收原假设,均值和方差的估计:,mu,sigma,muci,sigmaci=normfit(X) 运行结果如下: mu = 174.7000 sigma = 5.9586 muci =173.5177 175.8823sigmaci =5.2317 6.9220,二、一般分布的检验 单样本K-S检验命令 1)指数分布的检验 2)泊松分布的检验 双样本K-S检验:ks
13、test2,单样本K-S检验(Kolmogorov-Smirnov检验):kstest调用格式: H = kstest(X) %测试向量X是否服从标准正态分布,测试水平为5%。 H = kstest(X,cdf) %指定累积分布函数为cdf的测试(cdf= 时表示标准正态分布),测试水平为5% H = kstest(X,cdf,alpha) % alpha为指定测试水平H=kstest(X,cdf,alpha,tail) % tail=0为双侧检验, tail=1单侧() 检验 H,P,KSSTAT,CV = kstest(X,cdf,alpha) %P为原假设成立的概率,KSSTAT为测试统
14、计量的值,CV为是否接受假设的临界值。,例:, X=binocdf(0:20,20,0.5); H,p,k,c=kstest(X, ,0.05,0) H =1 p =2.8173e-005 k =0.5000 c =0.2873,X服从二项分布,不服从标准正态分布,拒绝原假设,1)指数分布的检验,例3 从一大批相同类型的元件中随机抽取10只做寿命试验,测得他们使用寿命(单位:h)为:420 500 920 1380 1510 1650 1760 2100 2320 2350 试问:电子元件的寿命是否服从均值为1500的指数分布?(alpha=0.05),程序如下:,X=420 500 920
15、1380 1510 1650 1760 2100 2320 2350; H,P,KSSTAT,CV = kstest(X,X,expcdf(X,1500),0.05) 运行结果: H = 0 P = 0.2700 KSSTAT =0.3015 CV = 0.4093,2)泊松分布的检验(对离散型不适合),x=poissrnd(5,2000,1); H,P,KSSTAT,CV = kstest(X,X,poisscdf(X,5),0.05),双样本K-S检验:kstest2 调用格式: (1)H=kstest2(X1,X2) (2)H=kstest2(X1,X2,alpha) (3)H=kste
16、st2(X1,X2,alpha,tail) (4)H,p,ksstat,cv=kstest2(.),例子, X=-1:1:5; Y=randn(20,1); H,p,k=kstest2(X,Y) H =1 p =0.0219 k =0.6143,Y是由randn生成的正态分布随机数,拒绝X和Y具有相同的分布的假设,三、列联表独立性的检验,如何编辑这样的函数,并调用程序? function chi2,chi21,h=indenpendencetest0(nij,alpha) %参考文献:应用数理统计(叶慈南编)p139. %独立性检验(列联表(contingency table)方法) %p14
17、1例3.5.4的数据:nij=nij=120 30;479 371;alpha=0.01 %p142例3.5.5的数据:nij=32 40 59 ;133 121 106;alpha=0.05 %调用格式:chi2,chi21,h=indenpendencetest0(nij,alpha) %Author: Ji Lin, 2007 if nargin=chi21 h=X与Y有关; else h=X与Y独立; end,P360例7.4.3 儿童智力发展与营养的关系 程序,nij=367 342 266 329;56 40 20 16; alpha=0.05; r,s=size(nij); %输
18、出矩阵的行数和列数 n=sum(sum(nij) % 求总和(先对列求和,再对行求和) ni=sum(nij) %对各行分别求和 nj=sum(nij) %对各列求和 chi2=n*sum(sum(nij-ni*nj/n).2)./(ni*nj);%卡方检验统计量的值 chi21=chi2inv(1-alpha,(r-1)*(s-1); %卡方分布的1-alpha分位数 if chi2=chi21 %判断检验统计量的值是不是大于分位数的值h=X与Y有关; else h=X与Y独立; end h,五、正态概率纸的构造原理,习题一,【实验习题】,习题二,习题三,习题四,习题一程序如下:,习题二程序如下:,