1、1,Confirmatory Factor Analysis,第六章 驗證型因素分析,2,大綱, 6.1 前言 6.2 驗證型因素分析:如何運作 6.3 樣本問題 (略) 6.4 驗證型因素分析之應用,3,6.1 前言,CFA屬於結構方程模式(SEM with latent variables)的一種次模型,CFA分析的數學原理與統計程序,都是SEM的一種特殊應用。CFA的進行必須有特定理論依據或概念架構作為基礎,然後藉由數學程序來確認該理論觀點所導出的計量模型是否確實、適當。CFA的參數估計可採最大概似估計法,而非矩陣分解,其優點為 提供模型適合度檢定統計量的值 提供估計參數之標準誤,4,探
2、索型因素分析與驗證型因素分析之比較,5,6.1.1 應用,(一)檢定因子模型之適合度透過驗證性因素分析,可針對特定因子模型衡量適合度,並測試其適當與否。案例Benjamin and Podolny(1996)想瞭解美國加州不同區域栽培葡萄的等級狀態,聘請10位專家對73個不同區域加以評等,評等等級為1(狀態差)7(狀態佳)。最後選取資料較完整(完成59個不同區域評等)的5位專家。,6,單因子模型(測量模型),7,Table 6.1 相關係數矩陣(五位專家對59個不同區域製酒狀態評等),CFA可計算模型適合度指標,以驗證單因子模型是否適合樣本資料的相關結構 透過驗證型因素分析,可以檢查因子結構狀
3、態及專家的可靠度(測量信度)。 以此題為例,相關係數均很高,故可知專家評等結果應該具一致性。CFA可提供信度及效度(收斂效度與區別效度)分析。,X1 X2 X3 X4 X5X1 1.00000 0.76490 0.67821 0.67515 0.68186X2 0.76490 1.00000 0.73522 0.62564 0.76585X3 0.67821 0.73522 1.00000 0.63170 0.71356 X4 0.67515 0.62564 0.63170 1.00000 0.51748X5 0.68186 0.76585 0.71356 0.51748 1.00000,8,
4、(二)評估建構(construct)的信效度,進行CFA時,可以使用模式配適度統計量(2)值與相關配適度指標(GFI、AGFI)來衡量變項的信度(reliability)與效度(validity)。信度:指標變數與潛伏變數之間相關程度(0.7)效度:可分為下列兩種 收歛效度(convergent validity):對相同特性(construct, concept, or research variables)使用不同衡量方法(Likert scale, Stapel scale, or semantic differential),所得結果高度相關。 區別效度(discriminant va
5、lidity):不同建構(construct, 即研究變數或稱concept) 彼此之間確實不相同。,9,Multitraitmultimethod matrix (多重特質多重方法)圖6.11. 李克尺度:Strongly Generally Moderately Moderately Generally StronglyAgree Agree Agree Disagree Disagree Disagree “Selection is wide.” _ _ _ _ _ _ 2. 語言差異尺度:Extremely Quite Slight Slight Quite Exremely Wide
6、 Selection _ _ _ _ _ _ Limited Selection3. 史德培尺度:+3 _+2 _+1 _Wide Selection-1 _-2 _ -3 _,10,表6.2 相關係數矩陣(針對連鎖商店的兩個特徵(store appearance, A and product assortment, P)分別採用三種不同方法(Likert scale, L, Differential scale, D, and Stapel scale, S) )AL AD AS PL PD PSAL 1.000AD 0.776 1.000AS 0.676 0.739 1.000PL 0.6
7、38 0.600 0.539 1.000PD 0.561 0.635 0.527 0.713 1.000PS 0.522 0.559 0.589 0.720 0.698 1.000,11,6.2 驗證型因素分析:如何運作,12,圖6.2 兩因子模型路徑圖:學生智力測驗模型,13,6.2.1 Intuition,執行驗證型因素分析時,應優先使用樣本共變數矩陣,而非相關係數矩陣。 此處因資料出版問題,無法取得共變數矩陣,故以相關係數矩陣做分析。1.000 .722 .714 .203 .095.722 1.000 .685 .246 .181 R = .714 .685 1.000 .170 .1
8、13.203 .246 .170 1.000 .585.095 .181 .113 .585 1.000,14,X1 = 111 + 122 + 1 X2 = 211 + 222 + 2 X3 = 311 + 322 + 3 (6.1) X4 = 411 + 422 + 4 X5 = 511 + 522 + 5,X1 = 111 + 1 X2 = 211 + 2 X3 = 311 + 3 (6.2) X4 = +422 + 4 X5 = +522 + 5Corr(1,2) = 12, var(1)=11, var(2)=22,探索性因子分析模型,驗證型因子分析模型,15,CFA模型的尺度不定性
9、 (scaling indeterminancy),Var(i)與所有的ij的值不能同時決定,兩者有抵換關係 尺度不定性的解決方法: 令每個因子的變異數為1, 或 將每一個因子與負荷在其上的變數間的值任選一個,並訂其值為1,16,11 021 0 factor loadings matrix = 31 0 0 42 0 52,factor correlation matrix 1 1221 1,17,(6.3),18,19,適合度指標 (p.181)衡量信度 (p.183)(6.5),(6.4),20,衡量指標,虛無假設the proposed model fits as well as a
10、perfect model,21,22,Measure Reliability (信度),定義:計算方式 Test-retest CFA 2,信度需0.7,23,6.2.2 Mechanism (P.184) (6.6)(6.7),Likelihood function,假設 XiN(0, ),24,(6.10)(6.11)(6.12),Final version of the log likelihood function,Obtain parameter estimates to maximize 6.12,MLE,25,模式適合度檢定,H0: Reduced model is indif
11、ferent from full model Ha: two models are significantly different Set =0.2,對n極為敏感,26,(6.16),(6.17),其他替代的模式適合度指標,0.95 good fit 0.9 acceptable fit,0.9 good fit 0.8 acceptable fit,27,Sample Problems,28,操作軟體:Lisrel,LISREL是一套用於SEM分析的統計套裝軟體。本章我們採用LISREL 8.7版做分析。,29,軟體操作:學生智力測驗成績 (P.181),30,軟體操作:學生智力測驗成績 (
12、P.181),31,Title Confirmatory Factor Analysis for student test performance Observed Variables 文章閱讀 造句能力 字彙能力 加法能力 計數能力 Correlation Matrix=10.722 10.714 0.685 10.203 0.246 0.170 10.095 0.181 0.113 0.585 1 Sample Size=145 Latent Variables 語言 數學 Relationships:文章閱讀=語言 造句能力=語言 字彙能力=語言加法能力=數學 計數能力=數學 SET t
13、he Covariance of 語言 and 數學 to 1 Path Diagram LISREL OUTPUT SE TV RS MI,相關矩陣,指標變數,潛伏變數,定義指標變數與潛伏變數之關係,輸出指令 SE: 標準誤 TV: t檢定 RS: 常態化殘差與Q圖 MI: 修飾指標,軟體操作:學生智力測驗成績 (P.181),32,軟體操作:學生智力測驗成績 (P.181),33,GFI=0.99 AGFI=0.97 RMR=0.022,卡方值=2.93,軟體操作:學生智力測驗成績 (P.181),34,Questions Regarding the Application of CFA,
14、35,Cronbachs alpha (6.18)其值介於01之間,若項目間相關係越高,值越高,亦即內部一致性越高。此公式假設指標內各item重要性一樣。(6.19),6.4.1 如何評估指標的信度,Average inter-item correlation among k items,此公式反映指標內各item重要性不一樣,36,例題:製酒企業 (P.172),Benjamin and Podolny(1996)想瞭解美國加洲不同區域栽培葡萄的狀態,聘請10位專家對73個不同區域加以評等,評等等級為1(狀態差)7(狀態佳)。最後選取資料較完整(完成59個不同區域評等)的5位專家。樣本量 :
15、59個不同區域指標變數:5位專家潛伏變數:status,37,路徑圖:製酒企業(P.188),2、 GFI、AGFI、RMR,採用Single dimension,1,2,3,4,5,Cronbachs =0.91,38,例題一 :製酒企業(P.188),Title Confirmatory Factor Analysis for Wine Industry Observed Variables expert1 expert2 expert3 expert4 expert5 Correlation Matrix=10.765 10.678 0.735 10.675 0.626 0.632 10
16、.682 0.766 0.714 0.517 1 Sample Size=59 Latent Variables Status Relationships:expert1=Status expert2=Status expert3=Status expert4=Status expert5=Status Path Diagram LISREL OUTPUT SE TV RS MI,Title:整個語法的標題,指標變數,相關矩陣:相關性高,樣本量,潛伏變數命名,指標變數與潛伏變數的關係,繪製路徑圖,輸出指令 SE: 標準誤 TV: t檢定 RS: 常態化殘差與Q圖 MI: 修飾指標,39,例題一
17、 :製酒企業(P.189),最可靠,信度最佳,最不可靠,信度最低,40,例題一 :製酒企業(p.189),參數最大概似估計、標準誤、t值: t值顯著2,殘差變異數估計、標準誤、t值:t值2仍顯著,41,GFI = 0.96 0.95 (佳) AGFI= 0.87 0.8 (可接受) RMR = 0.0310.05 (可接受),例題 :製酒企業 (p.189),卡方值 2 = 6.57,42,利用CFA檢定模式參數(見P.190) 檢定個因子以上 (P.191)透過驗證性因素分析,我們可以進行統計檢定,是否選擇多因子模型比單因子模型更合適。,6.4.2 如何比較不同因子模型,43,例題:學生智力
18、測驗成績 (P.191),之前分析建立在兩因子模型下(P.180),且能提供良好適合度,本例題測試在單因子模型下是否能提供更加適合度?樣本數 :145個學生指標變數:文章閱讀, 造句能力, 字彙能力, 加法能力, 計數能力潛伏變數:語言, 數學,44,路徑圖:學生智力測驗成績 (P.192),語言,文章 閱讀,2、 GFI、AGFI、,數學,造句 能力,字彙 能力,加法 能力,計數 能力,=1,採用Single dimension,1,2,3,4,5,45,Title Confirmatory Factor Analysis for student test performance Obser
19、ved Variables 文章閱讀 造句能力 字彙能力 加法能力 計數能力 Correlation Matrix=10.722 10.714 0.685 10.203 0.246 0.170 10.095 0.181 0.113 0.585 1 Sample Size=145 Latent Variables 語言 數學 Relationships:文章閱讀=語言 造句能力=語言 字彙能力=語言加法能力=數學 計數能力=數學 SET the Covariance of 語言 and 數學 to 1 Path Diagram LISREL OUTPUT SE TV RS MI,相關矩陣,指標變
20、數,潛伏變數,定義指標變數與潛伏變數之關係,軟體操作:學生智力測驗成績 (P.192),定義潛伏變數之間的關係 相關係數為1,不具區別效度,輸出指令 SE: 標準誤 TV: t檢定 RS: 常態化殘差與Q圖 MI: 修飾指標,46,軟體操作:學生智力測驗成績 (P.192),47,軟體操作:學生智力測驗成績 (P.192),參數最大概似估計、標準誤、t值: 語言:相關性較大、標準誤0.07、t值顯著2 數學:相關性小、標準誤0.09、t值2不顯著,兩潛伏變數之間的相關係數為1,殘差變異數估計、標準誤、t值,48,軟體操作:學生智力測驗成績 (P.192),卡方值 2 = 59.47,GFI =
21、 0.88 0.05 (皆低於可接受水準)模型配適度不佳,49,學生智力測驗成績綜合比較,50,限制或一般模型(P.192) 目的檢定較精簡的限制模型是否和所觀察的資料具致性,6.4.2 如何比較不同因子模型,51,例題 :製酒企業 (P.193),之前分析建立在專家之間的信度不相同的情況(P.189),能提供良好適合度,本例題測試在專家之間的信度皆相同之情況下,是否能提供更佳適合度?樣本量 :59個不同區域指標變數:5位專家潛伏變數:status,52,路徑圖:製酒企業(P.193),status,expert3,expert2,expert1,expert5,expert4,2、 GFI、
22、AGFI、RMR,1,2,3,4,5,53,Title Confirmatory Factor Analysis for Wine Inc. - restricted model Observed Variables expert1 expert2 expert3 expert4 expert5 Correlation Matrix=10.765 10.678 0.735 10.675 0.626 0.632 10.682 0.766 0.714 0.517 1 Sample Size=59 Latent Variables Status Relationships:expert1=Statu
23、s expert2=Status expert3=Status expert4=Status expert5=Status SET the path from Status to expert1 equal to the path from Status to expert2 SET the path from Status to expert2 equal to the path from Status to expert3 SET the path from Status to expert3 equal to the path from Status to expert4 SET the
24、 path from Status to expert4 equal to the path from Status to expert5 Equal error variances: expert1 expert2 expert3 expert4 expert5 Path Diagram LISREL OUTPUT SE TV RS MI,軟體操作: 製酒企業 (P.193),相關矩陣,指標變數,潛伏變數,定義指標變數與潛伏變數之關係,定義潛伏變數 之間的關係,輸出指令 SE: 標準誤 TV: t檢定 RS: 常態化殘差 MI: 修飾指標,54,軟體操作:製酒企業 (P.193),55,軟體
25、操作:製酒企業 (P.193),參數最大概似估計、標準誤、t值,殘差變異數估計、標準誤、t值,56,軟體操作:製酒企業 (P.193),卡方值,GFI (acceptable)、AGFI (acceptable)、RMR,57,製酒企業綜合比較 (p.193),58,考量其他不同簡單結構以外的衡量方法,6.4.3 簡單因子結構之外的變化(P.193),59,例題 :連鎖商店 (p.194),Menezes and Elber(1979)使用多重衡量方法,李克尺度(Likert Scale)、語意差異尺度(Semantic differential Scale)、史德培尺度(Stapel Sca
26、le)評估連鎖商店的商店外觀(store appearance)與產品多樣化(product assortment)特徵,樣本來源為250位夜校學生。樣本量 :250指標變數:AL、AD、AS、PL、PD、PS潛伏變數:store appearance、product assortment,60,路徑圖:連鎖商店-Simple Model (P.194),appearance,AL,2、 GFI、AGFI、,assortment,AD,AS,PL,PD,PS,1,2,3,4,5,6,61,Title Confirmatory Factor Analysis for Store Grocery-
27、 Simple model Observed Variables AL AD AS PL PD PS Correlation Matrix=1.000 0.776 1.0000.676 0.739 1.0000.638 0.600 0.539 1.0000.561 0.635 0.527 0.713 1.0000.522 0.559 0.589 0.720 0.698 1.000 Sample Size=250 Latent Variables APPEARANCE PRODUCT Relationships:AL=APPEARANCE AD=APPEARANCE AS=APPEARANCEP
28、L=PRODUCT PD=PRODUCTPS=PRODUCT Path Diagram LISREL OUTPUT SE TV RS MI,相關矩陣,指標變數,潛伏變數,定義指標變數與潛伏變數之關係,輸出指令 SE: 標準誤 TV: t檢定 RS: 常態化殘差與Q圖 MI: 修飾指標,軟體操作:連鎖商店-Simple Model,62,軟體操作:連鎖商店- Simple Model (P.195),63,參數最大概似估計、標準誤、t值,兩潛伏變數之間的相關性,軟體操作:連鎖商店-Simple Model (P.195),64,殘差變異數估計、標準誤、t值,卡方值,近似標準殘差矩陣Asympto
29、tically Standardized Residual Matrix,軟體操作:連鎖商店- Simple Model (P.195),GFI (good)、 AGFI (acceptable),65,採用(multitrait, multimethed model,MTMM) 多重特質多重方法,以測量理論架構的效度。收歛效度(convergent validity):對相同特性使用不同衡量方法,所得結果高度相關。區別效度(discriminant):不同構面彼此之間確實不相同。(不完全相關),例題:連鎖商店-Method Factors (P.194),66,67,68,路徑圖:連鎖商店-
30、Method Factors(P.197),appearance,AL,2、 GFI、AGFI、,product,AD,AS,PL,PD,PS,(參p.194) 考量方法因素,使用相同尺度衡量不同因素。,69,軟體操作:連鎖商店-Method Factors (P.196),相關矩陣,增加三個潛伏變數,定義指標變數與潛伏變數的關係,定義潛伏變數之間的關係,70,軟體操作:連鎖商店-Method Factors (P.195),新增部分,參數最大概似估計,殘差項係數,71,軟體操作:連鎖商店-Method Factors (P.195),額外增加三種衡量尺度的參數最大概似估計,參數最大概似估計,
31、兩潛伏變數之間的關係,72,軟體操作:連鎖商店-Method Factors (P.195),殘差變異數估計,卡方值、自由度,GFI、AGFI、RMR,73,在Simple Model中,未考量殘差之間的相關性,現在我們加入殘差項之間的共變性,加以研究。,例題: 連鎖商店-Correlated Error (P.197),參考P.197,74,75,路徑圖:連鎖商店- Correlated Error (P.198),appearance,AL,product,AD,AS,PL,PD,PS,考量誤差項,加入殘差項之間的共變性,1,2,3,4,5,6,76,軟體操作:連鎖商店- Correlat
32、ed Error,Title EX1: Confirmatory Factor Analysis for grocery store-correlated error Observed Variables AL AD AS PL PD PS Correlation Matrix=1.000 0.776 1.0000.676 0.739 1.0000.638 0.600 0.539 1.0000.561 0.635 0.527 0.713 1.0000.522 0.559 0.589 0.720 0.698 1.000 Sample Size=250 Latent Variables APPEA
33、RANCE PRODUCT Relationships:AL=APPEARANCEAD=APPEARANCEAS=APPEARANCEPL=PRODUCTPD=PRODUCTPS=PRODUCT SET the errors between AL and PL correlate SET the errors between AD and PD correlate SET the errors between AS and PS correlate Path Diagram LISREL OUTPUT SE TV RS MI,相關矩陣,對潛在變數進行標籤,定義指標變數與潛伏變數的關係,定義殘差的關係,77,軟體操作:連鎖商店- Correlated Error (P.195),新增誤差項部分,參數最大概似估計,殘差項係數,78,參數最大概似估計、標準誤、t值,軟體操作:連鎖商店- Correlated Error (P.195),兩潛伏變數之間的關係,79,殘差變異數估計、標準誤、t值,誤差變異數估計、標準誤、t值,卡方值,軟體操作:連鎖商店- Correlated Error (P.195),80,軟體操作:連鎖商店- Correlated Error (P.195),GFI(good)、AGFI(good)、RMR,81,實地演練,82, The End ,