1、1,第五章 估计和检验,第一节 区间估计 第二节 总体参数检验 第三节 总体参数比较 第四节 正态性检验,2,第一节 区间估计,一、基本概念 1、点估计 2、区间估计 3、需要置信估计的总体参数有:均值 、方差、 事件的概率 .,3,第一节 区间估计,二、用编程作置信区间 (一)capability过程作置信区间 过程capability的intervals语句提供了正态分 布总体均值和方差的各种类型的置信估计。为了 计算总体参数的置信区间,其最简单的用法为:proc capability data=数据集名 noprint;intervals 变量名列/method=4|6;run;,4,第
2、一节 区间估计,例如,为了从样本数据集class1得到变量height的均值置信区间可用以下程序:proc capability data=sasuser.class1 noprint;intervals height/method=4; run;,5,第一节 区间估计,在intervals语句后面的选项有: Method=4|6:method=4为计算均值的置信区间,method=6计算标准差的置信区间。 Alpha=:显著性水平,缺省为=0.01,0.05,0.10 Type=lower|twosided|upper:分别表示计算置信下 限、区间和上限,缺省为置信区间。,6,第一节 区间估
3、计,例如:计算变量weight均值、标准差的置信估计, 计算height标准差的置信下限,可提交以下程序:proc capability data=sasuser.class1 noprint;intervals weight/method=4,6 alpha=0.10,0.05;intervals height/method=6 alpha=0.05,0.025 type=lower; run;,7,第一节 区间估计,(二)means过程作均值的置信区间在means过程中提供了计算均值的置信区间的功能。其一般格式为:proc means data=数据集名 clm|lclm|uclm alp
4、ha=显著水平;var 变量名列; run;,8,第一节 区间估计,例如:计算class1中weight均值的90%置信区间。 proc means data=sasuser.class1 clm alpha=0.10 maxdec=2;var weight; run;,9,第二节 总体参数检验,假设检验的内容包括: (一)正态总体均值的检验方差已知时 用 统计量检验方差未知时 用 统计量检验 (二)正态总体方差的检验(卡方分布) (三)概率的检验。如次品率是否低于某个值。,10,第二节 总体参数检验,检验方法: (以Z统计量为例) P=P(|Z|z|):小z为样本观测值计算统计量Z的数值。
5、当P= 表示小概率事件未发生,接受原假设,11,第二节 总体参数检验,一、用分析员应用作参数检验在分析员应用种,打开数据集后,要 利用打开的数据集进行参数检验都从下列 方式进入:statistics =hypothesis tests,12,第二节 总体参数检验,(一)方差已知的均值检验例题:已知某炼铁厂的铁水含碳量在 正常情况下遵从N(4.55,0.1082)。现在测了 五炉铁水,其含碳量分别为4.28,4.40, 4.42,4.35,4.37,如果标准差没有改变, 总体均值是否有显著变化?作假设H0: =4.55,H1: =4.55,13,第二节 总体参数检验,(二)方差未知的均值检验例题
6、:某糖厂用自动打包机包装糖,每包糖 的重量遵从正态分布,其标准重量为100斤,某 日开工后测得9包重量如下:99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5 能否判断该日打包机工作正常( =0.05)?(数 据为:p159)作假设: H0: =100,H1: =100,14,第二节 总体参数检验,(三)比例检验例如用数据集class1的数据检验总体中 男女生比例是否相等,则可选单样本比例 检验法。若p表示总体中男生的比例,则检 验的是:H0: p=0.5,H1: p=0.5,15,第二节 总体参数检验,(四)方差检验例题:已知某维尼纶厂所生产的维
7、尼 纶纤度平日服从正态分布N(1.405,0.0482), 某日抽取5根纤维,测得其纤度为:1.32 1.55 1.36 1.40 1.44 问该日维尼纶纤度总体方差 是否正常? 作假设: H0: = 0.0482 ,H1: = 0.0482,16,第二节 总体参数检验,四、用编程作参数检验过程univariate的缺省输出结果包括了 检验均值为零的t检验的结果。为了检验设 定的非零均值,就需要事先将变量各观测 值减去设定值。例如用数据集class1对变量 weight检验H0: =50。可使用下列程序:,17,第二节 总体参数检验,data tem;set sasuser.class1;w1
8、=weight-50;run;proc univariate data=tem;var w1; run;,18,第二节 总体参数检验,过程means也提供检验H0: =0的t统计量数值和对 应的p值。例如对uinvariate过程的程序进行修改:data tem;set sasuser.class1;w1=weight-50;run;proc means data=tem maxdec=4 t prt;var w1; run; T-t统计量 Prt-p值,19,第三节 总体参数比较,总体参数的比较内容: 1、独立样本的方差比较=利用F统计量 2、独立样本的均值比较=利用T统计量分为两种情况:方
9、差齐性和方差非齐性 3、配对样本的均值比较=利用T统计量 4、总体比例的比较=利用Z统计量,20,第三节 总体参数比较,一、用分析员应用作参数比较 (一)独立样本方差比较例p171:有两台铣床生产同一种型号的套管, 平日这两台铣床加工的套管内槽深度都服从正态 分布,现要比较它们所生产的套管内槽深度的方 差。从这两台铣床产品中分别抽出8个和9个,测 得深度数据(mm)如下:,21,第三节 总体参数比较,第一台铣床:15.2,15.1,14.8,14.8,15.5,15.2,15.0,14.5 第二台铣床:15.2,14.8,15.0,14.8,15.1,15.2,14.8,15.0,15.0 试
10、判断第二台铣床产品的方差是否比第一台铣床的小( =0.05)? 作假设:H0: H1:,22,第三节 总体参数比较,上述的例题给出了两个样本,当然我们 也可以用单样本来做。实际上就是将两个样 本和在一起,然后进行分组。例如数据集 class1,要比较男女生总体的身高方差是否有 显著差异。设男生身高方差为 ,女生为。做假设:H0: H1:,23,第三节 总体参数比较,(二)独立样本均值比较 方差齐性情况通过上面的独立样本方差比较,我们知道了 数据集class1中,男女生身高的方差没有显著性 差异,也就是说男女生两个总体的方差齐性。因 此我们来做男女生身高均值的比较,看是否有显 著性差异。作假设:
11、 H0: ,H1:,24,第三节 总体参数比较, 方差非齐性情况例p162.甲、乙两个煤矿平日产煤中含矸率 (%)指标是服从正态分布的。今分别从两坑所产 煤中各抽取7个样品,测得含矸率指标如下: 甲坑:5.9,3.8,6.5,18.3,18.2,16.1,7.6 乙坑:7.6,0.4,1.1, 3.2,5.5, 4.1,4.7 能否判断出它们的含矸率有明显差异( =0.05 )? 注:首先检验方差齐性与非齐性,25,第三节 总体参数比较,(三)配对样本的均值比较例w143. 为了考察一种减缓心跳的药 物的疗效,分别对15个测试者记录了他们 服药前后的心跳次数。数据集w143记录了 这些结果。它
12、包含两个变量pre和post分别 代表服药前后的心跳次数。检验这种药品 的疗效( =0.05 )。作假设: H0: ,H1:,26,第三节 总体参数比较,(四)总体比例的比较例p165.某材料公司作某种板材防蚀试验,以 两种不同的防腐剂各给200块样材涂抹处理,经 过试验后,第一类样材(one)有56块被腐蚀, 第二类(two)有28块被腐蚀。试问两种防腐剂 性能上有无真正的差异( =0.05) ?这里我们考察腐蚀率,做假设:H0:P1=P2 H1: P1=P2,27,第三节 总体参数比较,二、用编程作均值比较 (一)独立样本均值比较过程ttest是专用于进行独立样本均值比较的t检 验法的。调
13、用此过程的一般形式为:proc ttest data=数据集名;class 分类变量名;var 分析变量名列;run; 程序说明: class语句:其后跟的分类变量必须且只能有两个水平。而且class语句必须同proc ttest过程一起使用。,28,第三节 总体参数比较,proc ttest data=sasuser.class1;class sex;var height;run;如果两个样本不是记录在同一分析变 量下的,可按程序mp162处理(用例题 p162),29,第三节 总体参数比较,(二)配对样本的均值比较过程means可以对配对样本均值进行比较。对 例题w143进行均值比较。利用
14、下列程序:(w147)data tem;set sasuser.w143;d=pre-post;run;proc means data=tem mean stderr t prt maxdec=4;var d;run;,30,第四节 正态性检验,前面我们做的参数估计和假设检验中, 常常假定总体是正态分布的。这一假定也 需要用样本来检验。当然对分布的检验也 不仅限于正态分布,还有其它的分布。这 里我们只介绍总体正态性的检验。,31,第四节 正态性检验,一、用insight作分布检验和置信带以class1为例,在insight中作变量weight的分布检验。具体步骤为: 1、analyze=dis
15、tribution(Y) 2、weight=Y 3、点击output按钮。在弹出的对话框中点击cumulative distribution按钮。,32,第四节 正态性检验,4、在cumulative distribution对话框中选empirical;在confidence bands下选95%;在fit paramitric下选normal;在tests for distribution下选normal。点击OK。 5、OK。,33,第四节 正态性检验,二、用分析员应用作分布检验用数据集class1检验变量weight的总体分布是 否为正态的,则可从下拉菜单开始: 1、statistics=descriptive=distributions 2、weight=analysis 3、点击fit按钮,选normal 4、OK。,34,第四节 正态性检验,三、用编程的方法作分布检验这里用到了capability过程。检验变量 weight分布的正态性程序如下:proc capability data=sasuser.class1 noprint;histogram weight / normal;run; 产生的结果说明变量weight服从正态分布。,35,