1、因素分析 Factor Analysis,羅 惠 瓊 淡 江 大 學 企 管 系 2005.11.25,因素分析之意義,因素分析(Factor Analysis)起源於心理學(約在1904年),因為在心理學研究領域常遇到一些如智力、道德、操守等不能直接測量的因素,而事實上我們對這些觀念也相當含糊,希望經由可測量的變數訂定出這些因素。 因素分析也是研究一份測驗建構效度(Construct Validity)最有效的方法之一,藉由因素的發現可確定心理學上一些特質觀念的結構成份,更可因此而得知測驗中有效的測量因素是那些。 因素分析是想將為眾多的變數濃縮成為少數幾個有意義因素,而又能保存住原有資料結構
2、所提供的大部分資訊。 因素分析是想以少數幾個因素來解釋一群相互之間有關係存在的變數之數學模式。,問卷調查範例,非常 非常同意 同意 無意見 不同意 不同意1. 大體來說,我對我自己十分滿意 2. 有時我會覺得自己一無是處 3. 我覺得自己有許多優點 4. 我自信我可以和別人表現得一樣好 5. 我時常覺得自己沒有什麼好驕傲的 6. 有時候我的確感到自己沒有什麼用處 7. 我覺得自己和別人一樣有價值 8. 我十分地看重自己 9. 我常會覺得自己是一個失敗者 10. 我對我自己抱持積極的態度 ,此問卷想要測量什麼?,範例自尊的評量Rosenberg(1965),(Rosenberg),範例(續) 因
3、素分析後之因素負荷量矩陣,因素分析之類型,探索性因素分析(Exploratory factor analysis) 用來試探、描述、分類和分析正在研究中的社會及行為科學。通常研究者對其所編製的測驗或量表到底能夠測出那幾個因素仍不清楚,沒有預先提出它們可測出幾個共同素之研究假設。 驗証性因素分析(Confirmatory factor analysis) 在觀察變數(X1,X2, Xp)與所萃取之潛在因素(Y1,Y2,Yq)有一定理論架構之前提下,為驗證理論架構與實際資料之相容性,所進行之因素分析。,由三個變數x1, x2, x3找到2個共同因素f1, f2,則其路徑圖如下,其中表可觀測的, 表
4、不可觀測的。 Note: 在驗證性因素分析路徑圖中並非每個因素 fi 皆與變數xi 間有連線(即路徑) 一般使用LISREL分析方法,探索性因素分析 v.s. 驗証性因素分析,因素分析之主要的功能,發掘多變量資料中各變數間複雜的組合型式。 進行探索性的研究,以找出潛在的共同特徵,供未來實驗之用。 發展變數間的實證類型。 減少多變量資料的維度。 將預測變數加以轉換,使其結構單純化後,再應用某些技術加以處理。 將知覺與偏好資料尺度化,並展現一空間中。,因素分析之假設,樣本單位在某一變數上的分數,由共同因素(common factor,Fi)與獨特因素(unique factor,Ui)所組成。 共
5、同因素:各變數共有的成份。 獨特因素:每個變數所獨有的成份。 獨特因素有二個假設 所有獨特因素彼此沒有相關 所有獨特因素和所有共同因素間也沒有相關,理論架構1 -數學模式,Zjn=aj1F1n+aj2F2n+ajqFqn+djUjn,其中Zjn:第n個樣本單位在第j個觀察變數的分數Fin:第n個樣本單位在第i個共同因素之分數Ujn:第n單位在第j個觀察變數的獨特因素之分數aji:為因素權重(factor weight) ,用以表示第i個共同因素對第j個觀察變數之權重,又稱為組型負荷量(pattern loading) dj:第j個觀察變數之獨特因素的權重 且假設 Z、F、U均為已標準化之分數,
6、j=1,2,p, n=1,2,N,理論架構2共同性和獨特性,其中 j2:第 j 個觀察變數之變異數hj2:觀察變數 j 之共同性 (所有共同因素解釋變數 j 之變異的能力)dj2:觀察變數 j 的獨特性(變數j的獨特因素所解釋的變異數部份)若共同因素之間沒有相關存在,則共同性(hj2)為hj2=aj12+aj22+ajq2,j2 = 1 = hj2 + dj2,=,理論架構3-結構負荷量,結構負荷量:各因素和變數間之相關係數,即,rZjFp=,ZjiFpi,i,n,樣本大小的原則,一般原則是要求樣本數目至少要有變數個數的5倍,最適者為一比十的比例。,探索性因素分析的步驟,(一) 決定應否進行因
7、素分析以減少原始變數的維度 (二) 萃取共同因素 (三) 決定需要抽取之共同因素的數目 (四) 因素轉軸 (五) 解釋共同因素代表的意義或分析結果,(一) 決定是否適合做因素分析,在進行因素分析尋求較少之因素來代表較多之變數之前,應先確定各變數分數間具有共同變異之存在,如此才值得作因素分析。 檢驗相關係數是否適當的方法:1. KMO取樣適當性量數(Kaiser-Meyer-Olkin measure of sampling adequacy)KMO值愈大時,表示變數間的共同因素愈多,愈適合進行因素分析,其準則如下:2. Bartletts球形考驗( Bartletts test of sphe
8、ricity ):Bartlett 球形考驗,若顯著,表示母體相關矩陣間有共同因素存在,適合進行因素分析。,(二) 共同因素之萃取方法,主軸法(method of principal) 是以共同因素對總共同性之貢獻極大化為萃取原則 重心法(centroid method of factoring) 在電腦普及以前,常以重心法估計組型負荷量 重心法是根據觀察變數之相關係數矩陣計算組型負荷量 最大概似法(maximum likelihood analysis) 需先假設共同因素之個數及服從常態分配,然後依此假定推導因素及共同性 缺點計算過程相當繁複且不一定得到收斂的結果 較適用於驗證性因素分析,主
9、軸法 1,抽取因素的順序是以能對各變數之共同性產生最大貢獻之因素優先抽取。較重心法客觀且嚴謹。 原理目標式,主軸法 2,原理(續) 為得目標式之解,建立下列拉式方程式可獲得p組特徵值與特徵向量A 令 則 i = Vi(第 i 個共同因素可解釋所有觀察變數的總變異)且 i 所對應之特徵向量即為第 i 個共同因素之組型負荷,主軸法 3主成份分析(1),假設各共同因素間彼此均無關聯,即相關係數為零,也不考慮變數分數中的獨特因素。 模式,Zj=aj1F1+aj2F2+ajqFq,結構負荷量等於該變數在第i個因素上 之組型負量,主軸法 4主成份分析(2),估計方法 以1置入原相關係數矩陣之對角線上,作為
10、共同性之數值而不對共同性另作估計。 優點 所得之共同因素彼此無相關 缺點 忽略獨特性,故共同性有高估的危險,主軸法 5主要因素法(1),主要因素法(method of principal factor)認為在萃取共同因素之過程中獨特變數可能發生干擾作用,觀察變數之真正變異不只有共同性。 估計方法 取小於1之值為共同性置入相關係數矩陣之對角線,進行因素分析。,主軸法 6主要因素法(2),共同性之估計hj 複相關係數平方法(Squared Multiple Correlation,SMC) 為共同性估計值之下限 反覆因素抽取法(Refactoring Method) 理論上最接近真正的共同性 變數
11、的數目在30個以上時,上述二種估計方法和主成份所得的共同性很接近。若變數在30個以下,則反覆因素抽取法的效果最好,SMC次之,主成份法較差。 缺點 值可能是負值 各共同因素間可能不獨立,(三) 決定共同素之數目原則,原則 萃取抽取的因素愈少愈好,而萃取出之因素能解釋各變數之變異數則愈大愈好。,(三) 決定共同素之數目方法1,參考理論架構及過去有關文獻來決定抽取共同因素之數目。 因素之特徵值(eigenvalue)須大於1。(H. Kaiser)所謂特徵值,是指每一行因素負荷量平方加總後之總和,表示該因素能解釋全體變異的能力。因每一變數之變異數均為1,若所抽取之因素所能解釋的變異數小於1,則其解
12、釋變數之變異數的效力便不如單一變數。 缺點:變數少於20之研究中取出的因素偏少,而變數多於50之研究中取出之因素卻偏多。,(三) 決定共同素之數目方法2,兩因素負荷量的差大於0.3者 利用因素陡坡圖檢驗(scree test)(R. Cattell,1966) 。 當特徵值開始很平滑下降時就不取。 在75%之變異數已能被抽取出之因素加以解釋後繼續抽取之因素對變異數之解釋如少於5%則不予選取。,範例自尊評量的未轉軸因素分析報表,(四)因素轉軸,目的 使各因素解更為清晰明瞭,以提供較充份的資訊。,轉軸的方法,直交轉軸法(orthogonal rotation) 兩軸維持著90度的旋轉,旋轉至最大解
13、釋量之點。 問題各因素間通常存有某種關係,若硬性規定它們之間的關係是直角難免有與事實不符情事。 斜交轉軸法(oblique rotation) 兩軸非維持90度的旋轉。 問題無法作不同研究間之比較。,轉軸前後原理圖示,直交轉軸法與斜交轉軸法之差異,直交解的因素組型即為其因素結構。 因素組型 指變數以因素的線性結合表示時各因素之係數所組成之矩陣 因素結構 係由變數與因素間之相關係數所組成之矩陣,直交轉軸法1,四方最大法(Quartimax) 使因素負荷矩陣同一橫列(變數)上高負荷量和低負荷量的數目儘量多,而中等負荷量的數目儘量減少,以符合簡單結構的原則。為達到其目的,此法係先將因素負荷矩陣中的各
14、負荷量予以平方,再使同一變數上這些平方值的變異數為最大。,直交轉軸法2,變異數最大法(Varimax)(Kaiser,1958) 與四方最大法相反,其要使因素矩陣同一直行(因素) 結構簡單化。為達到其目的,此法係先將因素矩陣中的各負荷量予以平方,再使同一因素上各平方值的變異數為最大。 此法轉軸後所得之因素結構較為簡單,且容易解釋,故使用最廣。,(五) 因素命名準則,以負荷值最大的作為優先命名。 例如,問題之因素一可命名為正面肯定,因素二 可命名為負面評價。,範例操作步驟1,問題操作步驟2,問題操作步驟3,問題操作步驟4,問題操作步驟5,問題操作步驟6,問題操作步驟7,範例報表解析1,KMO值為
15、0.879,表示變數的共同因素多,適合作因素分析。,由於p-value0.000,小於0.05,因此顯著,表示母體相關矩陣間有共同因素存在,可進一步進行因素分析。,範例報表解析2,我們以特徵值大於1為萃取因素的標準,共萃取出兩個因素。轉軸後第一個因素的特徵值為3.322,第二個因素的特徵值為2.302,其解釋變異量分別為33.215與23.024,合計共解釋了56.239的變異量。,範例報表解析3,由陡坡圖決定因素個數,在此選取兩個因素。,範例報表解析4,在此成分矩陣中,由於有模糊地帶,無法將10個變數分別歸至兩個因素中,因此以轉軸後的成分矩陣進行歸類。,範例報表解析5,因素一命名為正面肯定,因素二命名為負面評價,獨特性,0.501 0.364 0.467 0.429 0.555 0.266 0.368 0.395 0.45 0.582,1 - hi2 = ei2,ei2,範例報表解析6,範例報表解析7,F正面肯定 0.265 I57 0.250 I58 0.287 I54 0.218 I51 0.202 I53 0.203 I60F負面評價 0.399 I56 0.369 I52 0.376 I55 0.274 I59,