1、第三章 符号检验法3.1 符号检验函数 signtest格式 p = signtest(x) 原假设为 x 的中位数为 0,显著性水平为 0.05 的双侧检验。p = signtest(x,m) 原假设为 x 的中位数为 m,显著性水平为 0.05 的双侧检验。p = signtest(x,m,alpha) 原假设为 x 的中位数为 m,显著性水平为alpha 的双侧检验。p,h,stats = signtest(x,m,alpha),当样本小于 100 时,stats 只会显示 sign,取 x 小于假设中位数 m 的个数与大于假设中位数 m 的个数的较小值,当样本容量大于或等于 100 时
2、,stats 还将显示zval,即正态统计量值。 45.02)1(5.0nkpnkZ k 为大于中位数的个数,当 k 大于 n/2 时,取负号,当 k 小于 n/2 时,号取正号。p,h = signtest(.,alpha, alpha)例:p,h = signtest(.,alpha, 0.01)p,h,stats = signtest(.,method, exact)用精确的方法p,h = signtest(.,method, approximate)用正态近似的方法p,h,stats=signtest(x,y,alpha,0.01,method,exact)p,h,stats=sign
3、test(y1,y2,0.01,method, approximate )例 3.1 某市劳动和社会保障部门的资料说明,1998 年高级技师的年收入的中位数为 21700,该市某个行业有一个由 50 名高级技师组成的样本,这些高级技师的年收入如下:23072 24370 20327 24296 22256 19140 25669 22404 26744 2674423406 20438 24890 24815 24556 18472 21514 22516 25112 2348026522 24074 18064 22590 25261 21180 26188 21625 24333 2314
4、618324 3598 26040 20846 20438 19474 19214 23072 26744 2344324630 26893 26485 18138 20179 26744 23554 25706 21588 179902170)(:2170)(: 10 XMHXMH ee建立一个 50 行和 1 列的向量 x,即上面那个数据。a=; %把上表数据粘到 a 中b=size(a);x=reshape(a,b(1)*b(2),1);format longp,h,stats=signtest(x,21700)p =0.06490864707227h =0stats = sign: 1
5、8sign 值的计算:length(x(find(x21700)ans =32length(x(find(x25000)ans =13 length(x(find(x21700)ans =96 p,h,stats=signtest(bb,21700)p =8.150399118268979e-004h =1stats = zval: 3.34763598180368sign: 54zval 值的计算:zval=(96-75-0.5)/(150/4)0.5 (96 大于 75,减去 0.5)zval=3.34763598180368p 值的计算:2*(1-normcdf(zval)ans =8.
6、150399118269647e-004对于右侧检验: 2170)(:2170)(: 10 XMHXMH eeP 值的计算:上面双侧检验所得 P 值除以 2,即得右侧检验的 P 值。对于:240)(:240)(: 10 XMHXMH eelength(bb(find(bb24000)ans =63length(bb(find(bb0)ans =23length(z(find(z6500)ans =13length(find(x6500)ans =26左侧检验的 P 值为:p/2ans =0.02662595704896在 0.05 显著性水平,接受备择假设,中位数低于 6500。区间估计:中位
7、数 me 的各层的区间估计第一层:置信度1-0.538ans =0.99999999999636或 1-binocdf(0,39,0.5)/0.5ans =0.99999999999636第二层:1-0.538-39*0.538ans =0.99999999985448或:1-binocdf(1,39,0.5)/0.5ans =0.99999999985448第十四层:1-binocdf(13,39,0.5)/0.5ans =0.94674808590207x1=sort(x)x1(14)x1(14)ans =5800x2=wrev(x1);x2(14)ans =6500因此,上限 6400置
8、信度为 0.94674808590207,区间估计为:5800,65002双侧检验:精确算法:2*binocdf(30,70,0.5)ans =0.281978921793662*(1-binocdf(39,70,0.5)ans =0.28197892179364正态近似:2*normcdf(35-40+0.5)/sqrt(70/4)ans =0.28205887576156接受原假设,新建住宅的房价中位数是每平方米 6500 元。3精确算法:binocdf(527,2079,0.5)ans =6.355204377699287e-1171-binocdf(1551,527+1552,0.5)
9、ans =0n 很大时,binocdf 不方便算近似算法:normcdf(2079/2-1552+0.5)/sqrt(2079/4)ans =5.334462242411411e-112因此,相信孩子过上更好的日子的成年人较多。点估计:p=1552/(1552+527)p =0.7465127465127595%的置信区间:npzp)1(2p-1.96*sqrt(p*(1-p)/(1552+527) p+1.96*sqrt(p*(1-p)/(1552+527)ans =0.72781343987309 0.765212053152404.65:65: 90.10 pp tHtHXPp=normcdf(157860*0.094-18154+0.5)/sqrt(157860*0.094*0.906)p =4.8162e-180因此,拒绝原假设。90.6%的分位数超过 65 岁。引深思考:157860*0.094ans =1.4839e+004若原题中的 18154 改为 15000,则:p=normcdf(157860*0.094-15000+0.5)/sqrt(157860*0.094*0.906)p =0.0829则在 0.1 显著性水平下,接受原假设。