1、比較平均數,內容大綱,4.1 認識比較平均數4.2 平均數檢定4.3 單一樣本T檢定4.4 獨立樣本T檢定4.5 成對樣本T檢定4.6 單因子變異數分析4.7 重複量數4.8 重要統計檢定值,4.1 認識比較平均數,比較平均數(compare means)是指一個名義變數(如性別)的類別(如男女)在區間尺度(如廣告態度)上的平均數差異。 在統計分析中,比較平均數是屬於單變量(univariate)的範疇。 所謂變量(variate)是針對所要衡量的對象而言(不是指變數,更不是指變數的類別)。,單變量分析(univariate analysis)顧名思義就是針對單一的變量進行描述與假設檢定,在分
2、析這方面,研究者會用適當的技術針對樣本做分析(第三章資料蒐集與樣本描述)。 在假說檢定方面,本章將說明區間資料的假說檢定,有關次序資料及名義資料的假說檢定,將在第六章無母數檢定說明。,假說檢定,假說的檢定有兩種方法:古典式或抽樣理論法 (classical or sampling theory approach) 貝氏法(Bayesian approach),古典式統計學(classical statistics)是對樣本資料做分析,以客觀的機率觀點,對所建立的假說(hypotheses)做棄卻或不棄卻(reject or fail to reject)的決定。貝氏統計學(Bayesian s
3、tatistics)延伸於古典統計學,也是用所蒐集到的樣本資料做決策,但是它還考慮到了其他可用的資訊。這些額外的資訊包括了基於相信程度(degree of belief)的主觀機率估計。這些主觀的估計是根據一般的經驗而來。這些估計值先以某種分配來表示(稱為事前分配,prior distribution),然後再根據所蒐集到的樣本資訊做調整。調整後的估計值(稱為事後分配,posterior distribution)可依以後蒐集到的資料再做修正,顯著性,在統計學上,以男、女在態度上的平均數差異是否顯著為例,對於顯著性的解釋是這樣的:在m人當中每次抽取男女各n人(n 我們可認為:男、女在態度上的平
4、均數差異沒有顯著差異,統計顯著性 (statistical significance),在抽樣理論法中,我們是根據樣本資訊來接受或棄卻我們所做的研究假說。由於任何樣本與其母體都有某種程度的不同,因此我們必須判斷這些差異是否具有統計顯著性(statistical significance)。 如果我們有充足的理由相信這些差異並不是完全由隨機抽樣誤差而來,那麼這些差異就有統計顯著性,實際顯著性 (practical significance),統計上有顯著性是一回事,實際上是否有顯著性(practical significance)是另外一回事。顯然說明了顯著性與認知有關。在日常生活中,對於顯著性
5、的認知是非常弔詭的事情,從一個抽樣而來,所獲得的結果可能是由於抽樣誤差所導致的,所以我們會認為這個差距不具有統計上的顯著性。研究者主要任務就是要判斷,從這個樣本所獲得的結果是否具有統計上的顯著性。要做好這個判斷,必須先對假說檢定的邏輯(logic of hypothesis testing)有所了解,假說檢定的邏輯,古典式的統計顯著性檢定涉及到兩種類型的檢 定。 虛無假說(null hypothesis)進行檢定所謂虛無假說就是對母體母數(parameter)與樣本統計量(statistic)之間並無差異存在的陳述。 對立假說(alternative hypothesis)在邏輯上,對立假說與
6、虛無假說是相反的,對立假說的不同類型反映了是屬於雙尾或單尾檢定。雙尾檢定又稱非方向性檢定考慮到兩種機率:平均天數可能大於50天或者可能小於50天的機率。在檢定這種假說時,棄卻區域(regions of rejection)分別在分配的兩個尾端。單尾檢定又稱方向性檢定是將不可能結果的所有機率置於某一尾端(此尾端是由對立假說所決定),統計檢定的結果只能讓我們棄卻或不棄卻假說,檢定這些假說時,我們要採取這樣的決策法則:如果分析的結果顯示我們不能棄卻虛無假說,就不要採取任何矯正行動。值得注意的是:我們要說不棄卻(not to reject),不要說接受(accept),因為虛無假說永遠不能被證實,所以
7、不能被接受。 利用SPSS,所傳回來的(所顯示的)值是顯著性(p值),我們要用顯著性和我們所設的顯著水準值做比較,如果顯著性大於值,未達顯著水準,則不棄卻虛無假說;如果顯著性小於值,達到顯著水準,則棄卻虛無假說。 本書所設定的顯著水準皆是0.05(0.05)。,對於顯著性所代表意義的解釋, 要看不同的統計檢定,有些檢定中,未達顯著水準表示未違反某種分析的假定(如第五章5.2節的誤差變異量的Levene檢定等式); 有些檢定的達到顯著水準表示變數間的關連性、差異性達到顯著; 有些檢定的達到顯著水準表示自變數在依變數上有顯著差異; 有些檢定的達到顯著水準表示自變數在若干個依變數上至少有一個依變數有
8、顯著差異,型一與型二誤差,型一誤差(Type I error, ),則真實的虛無假說會被棄卻,也就是將無罪之人加以定罪。值被稱為是顯著水準(level of significance),也就是棄卻虛無假說的機率。 型二誤差(Type II error, ),則錯誤的虛無假說並沒有被棄卻,也就是說開釋了一個有罪之人。在一個公正的司法體制下,減低將無罪之人判為有罪,比將有罪之人判為無罪更為重要。 同樣的,在假說檢定中,我們比較要強調的是型一誤差,統計檢定程序,統計顯著性的檢定,要遵循一定的程序。 這些步驟如下: 敘述虛無假說 選擇適當的統計檢定方法 決定顯著水準 計算統計量的值 查出臨界值(cri
9、tical value) 做決策,如果計算值大於臨界值,就要棄卻虛無假說,並做接受對立假說成立的結論;計算值小於臨界值,就不棄卻虛無假說,獨立樣本中每個處理水準均來自於同一母群體中的不同樣本,換句話說,對於不同的樣本隨機的給予不同的處理水準。 相關樣本的每個處理水準均來自於同一母群體中的同一樣本,換句話說,每個樣本都要給予相同的處理水準。 處理水準視研究目的而定,它可能是廣告類型、領導風格類型(對領導風格類型的認知)、飲料類別等,在SPSS程序中,獨立樣本要先交代分群變數 (grouping variable),並界定群組(define groups),在SPSS中適合利用區間資料以進行單變量
10、假說檢定的統計技術有 Compare Means及General Linear Model。 在Compare Means中又有Means、One-Sample T Test、Independent-Sample T Test、Paired-Samples T Test、One-Way ANOVA。 在General Linear Model中又有Univariate、Repeated Measures,4.2 平均數檢定,Compare Means(比較平均數法)中平均數檢定(Means)處理程序的目的,在於檢視兩群體的平均數是否有顯著性差異,研究者欲研究性別與消費量的關係所建立的虛無假說是
11、:兩群體的消費量平均數無顯著性差異。 同時研究者想要了解,性別(自變數)可以解釋消費量(依變數)之變異數的程度(亦即百分比多少),進入SPSS,開啟檔案(檔案名稱.Chap04Means.sav),資料檔中包括性別(名義尺度)及消費量(區間尺度) 按Analyze、Compare Means、Means(分析比較平均數法平均數),在Means視窗中,我們將依變項消費量選入Dependent List(依變數清單)下的方格中,將自變項性別選入Independent List(自變項清單)下的方格中。如圖4-3所示。,圖4-3 Means視窗,在Means視窗的右下角,按Options,就會產生M
12、eans: Options視窗,在此視窗中,我們可看到Cell Statistics(格統計量)的內定值是Mean(平均數)、Number of Cases(觀察值個數)、Standard Deviation(標準差),左邊其他的統計量由我們依需要自行選定。在此視窗的左下角點選Anova table and eta,如圖4-4所示,圖4-4 Means: Options視窗,SPSS輸出結果如下表所示在ANOVA摘要表中,顯著性0.3640.05(0.05是我們設定的顯著水準),未達顯著水準,所以我們接受虛無假說,而認為性別與消費量沒有顯著差異。在關連量數的表格中,Eta值是0.147,Eta
13、平方值是0.022,因此我們可以了解性別變項可以解釋消費量0.2%的變異程度。口語一點來說,消費量的多寡與性別的關係微乎其微,另外一個求取關連性強度的做法,就是按Analysis、General Linear Model、Univariate,在Univariate視窗中,將消費量選入Dependent Variable(依變項)下的方格中,將性別選入Fixed Factor(s)(固定因素)下的方格中,如圖4-5所示。這個例子所讀取的檔案仍然是Means.sav,圖4-5 Univariate視窗設定,在Univariate視窗中,按Options(選項),在Univariate: Opti
14、ons視窗的Display(顯示)中,勾選Estimates of effect size(效果大小估計)如圖4-6所示。,圖4-6 勾選Estimates of effect size(效果大小估計),輸出結果如下表所示。在受試者間效應項的檢定表中,淨相關Eta平方值(校正後的模式)為0.022,結果與上述分析一樣,4.3 單一樣本T檢定,單一樣本T檢定(One Sample T Test)是針對單一樣本、樣本數(n)30 的樣本平均數檢定。 在先前說明的平均數假說檢定中,其樣本數是n30的,而且其平均數的抽樣分配是呈常態分配的。但是如果樣本數n30,則平均數的抽樣分配不呈常態分配,而且是呈
15、某一種類型的學生t分配(student t distribution)。 隨著樣本數的不同每個樣本數都有特定的學生t分配。當樣本數增加時,t分配會呈常態分配。既然t分配有若干個類型,要用哪一個t分配才適當?這要看自由度(degree of freedom, df)而定,對單一樣本的平均數假說檢定, 自由度是樣本數減1(df=n-1),大海飲料公司的管理當局相信每位女學生每週平均飲料消費量是三罐。如果檢定的結果真有這麼多,則該公司的管理當局將會針對女學生做產品定位策略的擬定及測試。但是管理當局在實際的擬定及測試產品定位策略之前,要非常確信她們真正的消費量是三罐。該公司的研究人員對28位女學生進行
16、調查。虛無假說:每週平均消費量與3罐沒有顯著差異,開啟檔案(檔案名稱:.Chap04One Sample T Test.sav),資料檔中包括消費量(區間尺度)。 按Analyze、Compare Means、One-Sample T Test(分析比較平均數法單一樣本T檢 定),在One-Sample T Test(單一樣本T檢定 )視窗中,選定消費量作為Test Variable(s)( 檢定變數),在Test Value(檢定值)的方格內填入3,如圖4-7所示,圖4-7 One-Sample T Test視窗,在One-Sample T Test: Options(單一樣本T檢定:選項)
17、視窗中,我們可以決定Confidence Interval(信賴區間),SPSS的內定值為95%,如圖4-8所示,圖4-8 One-Sample T Test: Options視窗,SPSS在處理之後,在單一樣本檢定表所顯示的是雙尾t檢定的顯著性,如下表所示。顯著性=0.1960.05,未達顯著水準,所以我們不棄卻虛無假說,而接受女性消費者的每週平均消費量與3罐沒有顯著差異(也可以說,與3罐的差異不顯著),4.4 獨立樣本T檢定,行銷人員通常有興趣了解暴露於行銷組合變數(價格、產品、促銷、配銷)的不同群體所產生的反應之間有什麼差別。要解決這類問題,可用獨立樣本T檢定(Independent S
18、ample T Test,大海飲料公司想要了解不同性別的消費者在飲料的消費量上有無不同。虛無假說是這樣的:男性消費量與女性消費量的平均數並無顯著差異,開啟檔案(檔案名稱.Chap04Independent Sample T Test.SAV),資料檔中包括性別(名義尺度)以及消費量(區間尺度)。 按Analyze、Compare Means、Independent-Sample T Test(分析比較平均數法獨立樣本T檢定),在Independent-Sample T Test 視窗中,將消費量變項選入Test Variable(s)(檢定變數)方格中,將性別選入Grouping Variab
19、le(分組變數)方格中,如圖4-9所示,圖4-9 Independent-Sample T Test視窗,在Independent-Sample T Test視窗中 ,我們必須Define Groups(定義組別), 在這個例子中,我們是利用Use specified values(使用指定的數值),並以1代 表群組1(男性),以2代表群組2(女) 。如圖4-10所示。若自變項為連續變項(區間尺度的資料),則應選擇Cut Point(分割點),並在其後的的方格內輸入分組的臨界分數,也就是觀察值如果小於分割點的話,就被分成一組;大於或等於分割點的觀察值,就會被分到另外一組。,獨立樣本檢定我們必須
20、了解,平均數差異檢定的基本假設之一,就是兩群體的變異數具有同質性(homogeneity of variance)。因此,SPSS在進行t檢定前,會先測試二組的變異數是否具有同質性。在獨立樣本檢定表中,變異數相等的Levene檢定中其F值為0.584,顯著性=0.4520.05,未達顯著水準,故應接受變異數相等的虛無假說(虛無假說是:兩組的變異數相等)。,在獨立樣本檢定表中的假設變異數相等這一列,雙尾檢定的顯著性=0.8100.05,所以我們接受男性消費量與女性消費量的平均數並無顯著差異的虛無假說,在針對兩獨立群體的平均數進行差異性檢定時,先要檢定兩群體變異數相等的虛無假說,此虛無假說的棄卻與
21、否,決定了我們使用假設變異數相等或不假設變異數相等的t檢定,4.5 成對樣本T檢定,在專題研究中,通常都是獨立樣本。然而有時候我們有必要抽取相關樣本(relatedsamples)或者成對樣本(paired samples)例如,父母兒女、消費人員銷售經理、禮品部門附屬用品部門等。 由於我們先前說明的統計技術都是以獨立樣本為基礎。如果樣本是相依的話,則那些技術的使用並不適當,應使用成對樣本T檢定(Paired Samples T Test),我們把兩種飲料容氏飲料及太氏飲料 分別放在六個零售店內銷售(每一個零售店都 銷售這二種飲料)。管理當局有興趣了解: 容氏飲料及太氏飲料的銷售量是否不同 ?
22、在=0.05之下我們所建立的虛無假說是: 容氏飲料與太氏飲料的銷售量並無顯 著差異。,開啟檔案(檔案名稱:.Chap04Paird Sample T Test.SAV),資料檔中包括容氏飲 料、太式飲料,均為區間尺度。 在SPSS中按Analyze、Compare Means 、Paired-Samples T Test(分析 比較平均數法成對樣本T檢定),在 Paired-Samples T Test視窗中,Paired Variables(配對變數)為容氏飲料 太氏 飲料,如圖4-11所示,圖4-11 Paired-Samples T Test視窗所做的設定,所產生的結果如下表所示。雙尾檢
23、定的顯著性=0.1210.05,未達到所設定的顯著水準,因此我們接受容氏飲料與太氏飲料銷售量並無顯著差異的虛無假說。,4.6 單因子變異數分析,在以獨立樣本進行平均數差異檢定方面,單因子變異數分析(One-Way ANOVA)是指有一個自變數。 有二個自變數(因子)稱為二因子變異數分析(Two-Way ANOVA見第五章) 對於多個變量進行變異數分析,則稱為多變量變異數分析(MANOVA,見第十二章),我們在使用ANOVA時,要注意其前提假定: 隨機指派處理(treatment,如上例的各種包裝)到測試單位(test Chaps,如上例的商店)。以上例而言,各種不同包裝的產品指派到各商店是隨機
24、的。測量尺度至少是區間資料。測試組與控制組的變異數相等。處理效應(treatment effect,如不同包裝的銷售量)是可加性的(additive)。,大海飲料公司考慮到三種包裝形式: 1型(細長透明型)、2型(細長不透明型) 及3型(短胖透明型)。 由於這三型在包裝成本上有所不同,管理當局 會採用最便宜的3型包裝,除非1型、2型具有 銷售上的優勢。 管理當局想要了解,不同的包裝會影響銷售量嗎?研 究人員就將銷售這三種包裝的飲料的商店,隨機抽取 25家,並分別在各組(每組25家)樣本中分別銷售三 種包裝的產品。 在這個例子中,所建立的虛無假說是:三種包裝的銷售量無顯著性的差異,在SPSS中,
25、開啟檔案(檔案名稱 .Chap04One Way ANOVA.sav),資料檔中 的包裝(包裝類別)是名義尺度,銷售量(銷 售業績)是區間尺度。 按Analyze、Compare Means、One- Way ANOVA(分析比較平均數法 單因子變異數分析),在One-Way ANOVA 視窗中,將銷售量選入到Dependent List(依變數清單)下的方格中,將包裝 選入到Factor(因子)下的方格中, 如圖4-12所示。,圖4-12 One-Way ANOVA視窗中的設定,對比在One-Way ANOVA視窗中,按Contrasts,我們就可以看到One-Way ANOVA: Cont
26、rasts視窗,如圖4-13,在此視窗中的一些功能,可讓我們進行事前比較與趨勢分析。為什麼要進行事前比較?原因在於在進行變異數分析之前,研究者可能根據某些理論或相關文獻,而好奇的想要了解哪幾對平均數有所差異。在One-Way ANOVA: Contrasts視窗中,如勾選Polynomial(多項式)可進行趨勢分析。在Degree(次數)的下拉式方塊中,選單中共有Linear(線性)、Quadratic(二次趨勢)與Cubic(三次趨勢)。事前比較各處理水準的Coefficients(係數)總和必須等於0。如自變項有三個水準,我們想要比較包裝類型1與包裝類型2的平均數與包裝類型3的平均數,在這
27、種情況下,比較係數分別輸入0.5、0.5、1這三個係數。係數清單中係數的順序與因子變數的值是相對應的,係數清單中的第一個係數所對應的是因子變數中數值最小的(編碼數值最小的組別,如上例的包裝1),係數清單中的最後一個係數所對應的是因子變數中數值最大的(編碼數值最大的組別,如上例的包裝3),圖4-13 One-Way ANOVA: Contrasts視窗,事後多重比較 在One-Way ANOVA視窗中按Post Hoc,就會出現在 One-Way ANOVA: Post Hoc Multiple Comparisons (單因子變異數分析:Post Hoc多重比較)視窗,在此 視窗的Equal
28、Variances Assumed(假設相同的變異數) 方盒下的各統計值中,點選Scheffe、Tukey及Duncan這三個 比較常用的分析法,圖4-14所示,圖4-14 One-Way ANOVA: Post Hoc Multiple Comparisons視窗設定,ANOVA摘要表在ANOVA摘要表中,顯著性=0.2860.05,未達顯著水準,所以接受三種不同的包裝其銷售量並無顯著性差異存在的虛無假說。,在均等平均數的Robust檢定摘要表中,Brown-Forsythe統計量的顯著性=0.2860.05,未達顯著水準,所以接受三種不同的包裝其銷售量並無顯著性差異存在的虛無假說。,對比從
29、對比檢定表中可知,包裝類型1與包裝類型2的平均數與包裝類型3的平均數之間沒有顯著性差異(顯著性=0.2430.05)。,多重比較 例子中, 由於整體的F檢定 未達顯著水準, 因此就不必 進行事後比較檢定多重比較檢定的技術有十餘種,包括了:比較數目最大法(maximization number of comparisons)、每格數目不相同的補償法(unequal cell size comparison)、每格同質法(cell homogeneity)及或減低法( or reduction)。 使用最普遍的是Scheffe檢定。我們對於Scheffe檢定所做的假說是:沒有成對受試者的平均數是相
30、同的,4.7 重複量數,有時候我們有必要對二個(或以上)的相關樣 本進行平均數的差異性檢定。有時候,也對 成對樣本做檢定, 例如,我們要對父親、母親、孩子的態度平均分數做差異性檢定。在這種情況下,使用ANOVA並不恰當。 這時候我們要來檢定各成對群組的平均數差異(例如 ,檢定父親母親這一組、母親孩子這一組、 父親孩子這一組)一般線性模式(General Linear Model)的重複量數(Repeated Measure)適用於對相關樣本進行二個(或以上)平均數差異檢定,大海飲料公司為了要了解不同廣告類型的廣告效果,因此進行了一個研究。研究者要求15位受試者中的每位受試者觀看四種類型的廣告,
31、觀看之後要做回憶測試,要他們回憶每一則廣告的內容,並對他們的回憶深度及正確性做評分。 在這個例子中,虛無假設是:不同類型的廣告效果之間並無顯著差異,開啟檔案(檔案名稱:.Chap04Repeated Measures.sav)。資料檔中包括類型1、類型2、類型3、類型4的 區間尺度資料。按Analyze、General Linear Model、Repeated Measures(分析一般線性模式重複量數),在所 呈現的Repeated Measures Define Factor(s)(重複量數定 義因子)視窗中,在Within-Subject Factor Name(受試者 內因子的名稱)
32、右邊的方格中填入類型,在Number of Levels(水準個數)中填入4,並按Add(新增),加 入到其右邊的方盒內。在我們的例子中,共有四種類型的廣告。 在Measure Name(測量名稱)右邊的方格中,填入廣告效 果,並按Add(新增),加入到其右邊的方盒內, 如圖4-15所示。,圖4-15 Repeated Measures Define Factor(s)(重複量數定義因子)視窗,定義 在Repeated Measures Define Factor(s) (重複量數定義因子)視窗中按Define( 定義),就會產生Repeated Measures( 重複量數)視窗,在此視窗中
33、將類型選入 Within-Subjects Variables(受試者內變 數)下方的方格內,在還沒有選入之前,這些 變數名稱是:_?_ 、_?_ 、_?_ 、_?_ 選入之後就變成類型1 、類型2 、類型3 、類型4 。如圖4-16所示,圖4-16 Repeated Measures視窗,選項 在Repeated Measures視窗,按Options (選項),就會產生Repeated Measures: Options視窗。在此視窗中,我們可將類 型選入Display Means for(顯示平均 數)下的方格中,並選擇Compare main effects(比較主效果)以及在Disp
34、lay (顯示)下選擇Descriptive Statistics (敘述統計),如圖4-17所示。,圖4-17 Repeated Measures: Options視窗,Repeated Measures的SPSS輸出如下表所示。 受試者間效應項的檢定在受試者間效應項的檢定表中,F檢定的顯著性為0.0000.05,已達顯著水準,應棄卻虛無假說,而認為在不同類型的廣告下,其效果有顯著的不同。,Mauchly球形檢定 在Mauchly球形檢定表中,顯著性為 0.153 0.05,未達顯著水準,表示未違反 變異數分析的球形假定。 所謂球面性(sphericity)是指受測樣本於自變項的每一實驗處理中,在依變項上的得分,兩兩配對相減所得的差之變異數必須相等,換句話說,不同的受試者在不同水準間配對或重複測量,其變動情形應該具有一致性。相關樣本的變異數分析,如果違反了這項規定,將會提高型一誤差的機率,敘述統計從敘述統計表的資料來看,我們可以了解:類型4的效果最佳,而類型1的效果最差。,4.8 重要統計檢定值,第四章 課程結束,