1、2019/5/30,dsn2,1,Chap 2 二組資料比較,二組資料比較屬於 1 factor,2treatments 之實驗,分為 :二獨立樣本 - 1 factor complete randomized design二配對樣本 - paired comparison design (是一種 block design),分析資料的方法分別為 : 二獨立樣本 - t-test ( H0 : 1 = 2 ) 二配對樣本 - paired t-test ( H0 : D = 1 - 2 = 0 ),註:上述的 t-test 用於常態資料,2019/5/30,dsn2,2,題例 例 2.1:調查
2、二水泥砂漿配方產生的張力強度是否相同 (課本p24)以二配方生產的水泥砂漿各隨機抽取10個樣本,測得張力強度,此二組資料是否獨立?,例 2.2:比較兩種演算法所需 cpu 時間 影響cpu 時間的另一重要因素是題目的難易度,選擇10題,分別以兩種演算法計算,得到的資料是配對資料。,例 2.3:比較二硬度機針頭讀數之差異 (課本p49) 硬度讀數和金屬本身的硬度有極大關係,若取不同的金屬片, 得到的差異可能是金屬片的差異,而非針頭的差異,在設計實驗時,要平衡此 nuisance factor,故取10片金屬片,每片分成二份, 分別以二硬度機針頭讀出硬度,這設計屬於 block design,以此
3、得到的資料是配對資料。,例 2.1屬二獨立資料,例2.2 &2.3 屬二配對資料,2019/5/30,dsn2,3,【理論】 假設Y11, Y12, , Y1n1 is a random sample from N(1,12),Y21, Y22, , Y2n2 is a random sample from N(2,22),and Y1i, Y2j are independent.,比較二獨立樣本之分析法,注意,在常態的假設下,得到: 樣本平均數的分布與常態分布有關 樣本變異數的分布與卡方分布有關 樣本平均數與樣本變異數互相獨立,數統基本理論,說明?,2019/5/30,dsn2,4,說明?,
4、說明?,2019/5/30,dsn2,5,說明?,2019/5/30,dsn2,6,4. The Estimate of the standard error,針對 3 項中的二種情況,標準差的估計如下,得到的值稱為標準差 standard error (s.e.),因為此值代表估計時的誤差大小。 a. No assumption of the equality of 12 and 22,註:Si2 是 i2 的不偏估計量,且分佈與卡方分布有關。但 是(s.e.)2 的分布並非是卡方分布。,說明?,說明?,2019/5/30,dsn2,7,Sp2 是 2 的不偏估計量,且分布與卡方分布有關。,
5、証明?,2019/5/30,dsn2,8,5. The Testing Statistics for testing H0: 1 =2 a. Assume 12 22 (Satterthwaith method),2019/5/30,dsn2,9,t t(n1+n1-2) when H0 is true,証明?,2019/5/30,dsn2,10,6. 選擇 (a) or 選擇(b) ? Test H0: 12 = 22檢定量 F = S12 / S22 ; =0.05拒絕域 C = F is not in (F.975; ( n1-1,n2-1) , F .025; ( n1-1,n2-1)
6、 ),原理,從以上理論知,要檢定二平均數差異,要分為變異數相等與不相等,我們要如何知道母體的變異數是否相等?,2019/5/30,dsn2,11,Test H0: 12 = 22 vs. H1: 12 22,Reject H0 when f F /2 C.I. :,注意: 1.上述檢定法之前提皆為 Normal 假設。2. 變異數之F-test 對 normal 假設比較敏感。,註: F1-/2 ; n1,n2 = ( F/2 ; n2,n1 )-1,檢定變異數差異之說明,証明?,2019/5/30,dsn2,12,計算 f-值,使 f 1, 若 f F .025; ( n1,n2) ,假設二
7、組變異數不等, 使用 Satterthwaite 法 (a)。,選擇 (a) or (b) 之實作,說明,檢定 1 = 2,和二組的順序無關F.975; ( n1-1,n2-1) 1,2019/5/30,dsn2,13,以上的理論中做了那些假設 (assumption) ? 比較二組變異數與比較二組平均數基本上的差異為何?你覺得是否有意義?t 分佈與 F 分佈有何關係? 何時使用 t-test,何時使用 F-test ?,Think,2019/5/30,dsn2,14,1、預覽資料 (作比較圖)(i) 資料是否有特殊分佈?(ii) 分散度是否有明顯差異? (iii) 均值是否有明顯差異? 2、
8、檢測資料是否可假設來自常態母體(i) Normality test , (ii) 檢視 Normal probability plot 3、決定是否可假設二組的變異數相等用 F-test , H0: 12 = 22 , p-value 0.05時,設變異數相等 4、選擇平均數差異檢定法Test H0: 1 =2, 變異數相等時,用 pooled t-test變異數不等時,用 Satterthwaite test 5、必要時計算差異的信賴區間 6、結論,【二組資料比較的實作過程】,2019/5/30,dsn2,15,Case I 變異相等時,比較二獨立樣本,C.I. for 1 2:,Test
9、H0 : 1 =2 vs. H1: 1 2,2019/5/30,dsn2,16,Case II 變異不相等時,比較二獨立樣本,p-value = 2P(T|t|),C.I. for 1 2:,Test H0 : 1 =2 vs. H1: 1 2,2019/5/30,dsn2,17,【例 2.1】比較改良的與原來的水泥砂漿配方產生的張力強度 變因 : 二種配方 (1,modified, 2,unmodified) 觀察值 : 張力強度 data : p24,【分析】1. 樣本統計量及資料分布:,2019/5/30,dsn2,18,Box-plot,平均數差是 0.278,上圖是否顯示二組有明顯差
10、異? 二組變異是否相等?,Think,2019/5/30,dsn2,19,2. 資料是否來自常態母體?,由 Wilk-Shapiro test, 二組得到的 p-value 分別為 .3457, 及 .8153 (參考 output cement_Normal),Normal probability plot 結果接近一直線 (如下圖),故可假設二組資料來自常態。,formula 1 formula 2,2019/5/30,dsn2,20,3. 二組資料變異數是否相等?,查表得 F.025,(9,9) = 4.03, 在=0.05,可認定二組資料變異數相等 (p-value=0.4785 ,參
11、考 sas output cement_tt),2019/5/30,dsn2,21,t.025 ; (18) = 2.101, 拒絕 H0. (p-value= 0.0422 ,參考 sas output cement_tt ),4. 二組資料平均數是否相等?,在 5%的顯著水準下,二強度平均數有顯著差異。,註: p-value 非常接近 0.05,觀察先前的 box plot,是不是吻合?,Think,2019/5/30,dsn2,22,5. 差異之信賴區間Under 95% confidence level :,6. 結論在5% 的顯著水準下,二配方生產的水泥砂漿的張力強度有顯著的差異,以
12、95% 之信賴度估計,Formula 2 較 Formula 1 平均強度高 .011 到 .545。,請看看報表何處有出現s.e. = 0.1271,顯著的也就是明顯,2019/5/30,dsn2,23,Q: 如何決定樣本數?,Case I、控制信賴區間寬度要求信賴區間 Length L0,樣本數應取多少?,說明: 若變異數未知,以估計值代入。,2019/5/30,dsn2,24,Case II、控制型II 錯誤之機率 () 要求有 1- 的機會能分出差距為 的情況,樣本數應取多少?,說明:事實上,二組的平均數通常是有差異的,t-test 是指出有明顯差異的情況,在值固定下,二組平均數差異愈
13、大,被檢定出顯著的機會也愈大,此處的機會就是 1-值。對於差距小的二組,要分出差異,就得有夠大的樣本,我們針對特定的差距,指定一拒絕 H0 的機會,利用的公式就可知道樣本數了。, = Preject H0 | 1 =2 ,() = P accept H0 | |1 2| = ,的計算:R= |t| t/2, () = ? (與有關),2019/5/30,dsn2,25,= 0.05,d = 1:,【例】:比較水泥砂漿配方之例,假設平均張力強度的差異是0.5 kgf/cm2 時,會對水泥使用上造成影響,所以要求要有很大的機會檢定出二種水泥的平均強度超過此標準,若要求有 95% 機會測出差異, n
14、 應該多少?,d = 0.5/2,假設由之前的經標準差將不超過 0.25,以 0.25 代入,得到 d = 1,,另由 OC curve 查出: n* =2n-1=16,n = 9。我們應該各抽出 9 筆資料。,n=?,2019/5/30,dsn2,26,Figure 2.12 (p. 41) Operating characteristic curves for the two-sided t-test with = 0.05. (Reproduced with permission from “Operating Characteristics for the Common Statist
15、ical Tests of Significance,“ C. L. Ferris, F. E. Grubbs, and C. L. Weaver, Annals of Mathematical Statistics, June 1946.),OC curve : (Operating Characteristic curve ) 依據選定的 值可按圖得到適當的樣本數。,2019/5/30,dsn2,27,Data: (x1, y1), , (xn, yn)Let Di = xi - yi , i=1, n. Then D1 , , Dn is an i.i.d. normal sample
16、from a population with mean = x y .The one-sample techniques can be applied to D1 , , Dn,比較二配對樣本之分析法,【方法】,Paired t-test,2019/5/30,dsn2,28,【例 2.2】 比較兩種演算法所需 cpu 時間.觀察值 : 計算所需時間變因 :演算, treatments :演算法(I)、演算法(II)其他影響因素 : 題目的難易程度實驗設計 : 取10個題目,以二演算法得解,分別記錄 cpu 時間。,data : 10 problems for both types,分析: 用
17、paired t test,2019/5/30,dsn2,29,計算二組資料之差,t.025 ; (9) = 2.262, p-value=0.0005 結論 : 二組資料平均數差異顯著.,差異之信賴區間Under 95% confidence level :,2019/5/30,dsn2,30,【例 2.3 】Hardness Testing Experiment,主題:比較二硬度機針頭讀數之差異。 實驗: 選定10 specimen,分別用 tip1及 tip2測量硬度。 資料類型: paired samples 資料 : xi : tip1測得的硬度讀數 (p49)yi : tip2 測
18、得的硬度讀數,【解】 Test : H0 : X= Y versus H1 : X Y Let Di = xi - yi.,2019/5/30,dsn2,31,Do not reject H0 at =0.05,no significantly difference in hardness reading between 2 tips. A 95% C.I. for the average difference is,註: The design is called the paired comparison design, which is a special case of the randomized block design.使用 paired sample 有何優缺點 ? (p51),With 95% confidence level, the confidence interval for the difference is (-0.956, 0.756), which covers 0,(See sas output tips_tt),