1、十、變方分析 (Analysis of Variance),劉仁沛 教授 國立台灣大學農藝學研究所生物統計組 國家衛生研究院生物統計與生物資訊組 jpliuntu.edu.tw,變方分析(Analysis of Variance),F分配(F-Distribution) 變異數同質性之檢定(Homogeneity of Variance) 單項變方分析(One-way Analysis of Variance) 完全隨機設計(Completely Randomized Design) 容許區間(Tolerance Interval),例:痛風病人與正常人血中尿酸量之變異,痛風病人尿酸量之變異是
2、否大於正常人的變異,例:一個試驗比較三種飼料對天竺鼠體重 之影響,12隻天竺鼠隨機指派食用三種飼料(隻飼料;隻飼料;之飼料),兩星期後體重增加之觀測值(g),三種飼料對天竺鼠增重是否不同 三個族群平均值的比較,分佈,樣品變方(偏差平方和)之分佈卡方分佈 兩個獨立樣品變方(或平方和)之分佈 兩個獨立卡方變數之比的分佈分佈(F-Distribution) 分佈為紀念R.A. Fisher 而命名,故稱費氏分佈,分佈,為兩個卡方變數比之分佈 有兩個自由度 分子卡方分子自由度 分母卡方分母自由度 P.478-482,附表7 t為標準常態變數除以卡方平方根比之變數 t自由度為n1-1 t2為分子自由度為
3、1,分母自由度為n1-1之分佈 之倒數1/F亦為分佈:分子與分母自由度互換,痛風病人與正常人尿酸量之變異,拒絕H0痛瘋病人尿酸之變異大於正常人尿酸之變異,例:人工與儀器測定成年人血液中尿酸量(mg/ml),人工測定成人血液中尿酸的變異儀器測定法的變異,飼料與天竺鼠2週增重(g),飼料稱為處理組或處理(Treatment) 天竺鼠稱為試驗單位(Experimental Unit),影響天竺鼠2週增重變異的原因(變因),已知變因(Known Variation) 飼料品牌 未知變因(Unknown Variation) 試驗誤差(Experimental Error) 其他所有可能的原因 天竺鼠起
4、始體重 測量誤差 試驗環境 ,單項變方分析(One-way Analysis of Variance),飼料A第一號天竺鼠的兩週增重 兩週增重-總平均=(飼料A平均-總平均)+(兩週增重-飼料A平均) 飼料A平均-總平均=處理A與總平均之偏差=組間變異 兩週增重-飼料A平均=飼料A第一號天竺鼠與處理A之偏差=處理A組內變異,(兩週增重-總平均)2和 (-1)2+ (-5)2+ 22+ (-4)2+ (-4)2+ 22+ (-2)2+ 02+ 22+ 62+ 12+ 32=120 (飼料平均-總平均)2和 (-2)2+ (-2)2+ (-2)2+ (-2)2+ (-1)2+ (-1)2+ (-1
5、)2+ (-1)2+ 32+ 32+ 32+ 32=56 (兩週增重-飼料平均)2和 12+ (-3)2+ 42+ (-2)2+ (-3)2+ 32+ (-1)2+ (1)2+ (-1)2+ 32+ (-2)2+ 02=64 (兩週增重-總平均)2和=(飼料平均-總平均)2和+(兩週增重-飼料平均)2和120 = 56 + 64 總平方和=組間平方和+誤差平方和=處理平方和+誤差平方和,資料結構,處理平均:總平均:總樣品數:,總平方和總(平方和)自由度處理平方和處理(平方和)自由度,誤差平方和誤差自由度,總平方和=處理平方和+誤差平方和 總自由度=處理自由度+誤差自由度 SST=SSt+SSE
6、均方(Mean Square, MS): 平均的平方和=平方和/自由度 處理均方:MSt=SSt/(t-1) 誤差均方:MSE=SSE/(N-t),單項變方分析(One-way Analysis of Variance),將上述結果整理於變方分析表 Analysis of Variance Table (ANOVA Table) 第一行為變因(Source of Variation, SOV),例:飼料與天竺鼠兩週增重(g),ANOVA Table,例:微陣列試驗(Microarray Exp),基因數1,000試驗整體型誤差機率很高 基因無表現誤判有表現的機率很高 必須控制試驗整體型誤差機率
7、在顯著水準之下,多重比較(Multiple Comparisons),F值顯著處理平均值間有顯著差異,但不知哪兩個處理平均值間有顯著差異,必須進行處理間之兩兩比較 三個飼料:三個兩兩比較 A VS. B A VS. C B VS. C,多重比較(Multiple Comparisons),個別比較型誤差(Comparisonwise Type Error) 單一兩兩比較之型誤差試驗整體型誤差(Experimentwise Type Error) 飼料試驗一共有三個兩兩比較,其中任一個的型誤差,Fishers 最小顯著差異(Least Significance Difference, LSD),
8、決策方法:若處理i與i之LSD不包括0處理i與i之平均值間有顯著差異,例:飼料與天竺鼠兩週增重,Bonferroni多重比較方法,顯著水準:,兩兩比較個數:k 調整顯著水準: *=/k Bonferroni(1-)%信賴區間決策方法:若處理i與i之Bonferroni(1-)%信賴區間不包括0處理i與i之平均值間有顯著差異,例:飼料與天竺鼠兩週增重,Tukey忠誠顯著差異值 (Honest Significance Distance,HSD), m, dfE決策方法:若處理i與i之HSD不包括0處理i與i之平均值間有顯著差異,例:飼料與天竺鼠兩週增重,族群容許區間(Tolerance Interval),及2未知時必須修正為值,替代標準常態百分位值隨樣品數,信心水準(1-)與包含率(1-)而異,見P.490-492 附表13 所得的容許區間: 吾人有(1-)%信心水準,族群中(1-)%觀測值介於 之間 應用於品管方面: (1-)%信心保證(1-)%產品會在 之間應用於生物特性正常值範圍,例:某醫院位新生兒血液中含鈣 量(mg%),總結(Summary),F分配 變異數同質之檢定 單向變方分析 多重比較 容許區間,習題,P313 1, 4, 5, 8,