15 因素分析

譯者註 20240129完成jamovi示範之外的編修。

前幾個單元介紹的統計檢定方法主要是處理兩個或多個研究組之間的差異，不過有時候的研究目的是檢定多個變項的共變。也就是探討變項之間的關係,以及有關聯的變項所構成的模式是否有趣和有意義的東西。例如,研究者經常有興趣探索是否存在任何潛在的未觀察到的因素,這些因素是從直接測量的可觀察變項資料而揭露的。潛在因素的統計學定義是一開始為隱藏變項,不是直接觀察的,而是經由其他直接觀察或測量的變項推斷出來。

這個單元將介紹幾種因素分析和相關技術,首先是探索性因素分析 (EFA)。EFA是一種統計技術,用於識別潛藏在資料裡的潛在因素。然後是主成分分析,這是一種縮減資料變項的方法,嚴格來說,這種方法無法識別潛藏的潛在因素,僅用來建構觀察變項的線性組合。接著是驗證性因素分析,CFA與EFA不同之處是，前者從一個想法開始檢定資料中的變項之間的關係，所謂想法通常是一個模型。然後根據觀察到的資料檢驗模型,並評估模型的適配程度。CFA有一個種較複雜的版本–多種特質多項相關驗證性因素分析,包括檢定模型內的潛在因素和方法之間的變異。這種方法有用的原因是當研究者使用不同測量方法，那麼方法之間的變異就是一個重要的因素。最後要介紹的是內部一致性信度分析，這種相關分析是測試一種量表所評估之心理結構一致性。

15.1 探索性因素分析

探索性因素分析(EFA)是一種可以從觀察資料推斷出任何隱藏的潛在因素的統計技術，這種方法的原理是計算一組測量變項(例如$V_1、V_2、V_3、V_4$ 和 $V_5$)在多大程度上可以構成潛在因素的測量尺度。這種潛在因素不能只用一個觀察變項來測量,而是體現於受影響的一組觀察變項構成的關係網路。

以圖 15.1 來說，每個觀察變項 $V_i$ 都在一定程度上受到潛在因素($F$)的影響，影響力用係數 $b_1$ 到 $b_5$(也稱為因子負荷)表示。每個觀察變項$V_i$都有一個誤差項,也就是$e_1$ 到 $e_5$，代表與潛在因素無關的資料料誤差。

心理學的潛在因素通常是難以直接觀察或測量的心理現象或構造，像是個性,智力或思考模式。以圖 15.1 來說，觀察變項可以是五個請參與者回答的行為或態度之具體問題,影響五個問題的潛在因素可能是一種被學者稱為外向性的性格，另一組問題則可能受到內向性或責任感等潛在因素的影響。

這裡還有另一個範例:有一個測量統計焦慮的問卷，雖然統計焦慮無法直接測量，不過問卷中的每個問題能測量因統計課作業引發的一部分焦慮感。例如,“$Q1$:完成統計課程中的作業”,“$Q2$:試圖理解期刊文章中描述的統計”,和“$Q3$:向講師請教課程中不理解之處的幫助”等等，填答者從低焦慮到高焦慮給每題一個評分。若填答者有明顯的統計焦慮，每一題會傾向給較高的評分；反之，如果填答者沒有太明顯的統計焦慮，每一題會傾向給較低的評分。

探索性因素分析的本質是探索變項之間的相關性，從變項之間的共變關係識別任何有趣和重要的潛在因素。使用統計軟體可以評估任何潛在因素,以及與受潛在因素影響的每個變項的因素負荷量¹。例如因素負荷量 > 0.5的變項，很可能是測量潛在因素的有效指標。計算因素負荷量的過程之一稱為轉軸法(rotation)，這是一個目前不好懂的名詞，好在目前讀者不需要理解這個過程，只要知道轉軸能清理不同因素對同一組變項的因素負荷量。經過轉軸法的處理，能清楚地看到哪些變項與每個潛在因素有實質的關聯性。此外，還要決定需要多少因素才能合理解釋資料，這就需要計算特徵值(Eigen value)。介紹探索性因素分析的執行條件之後，我們再回來討論這些名詞。

15.1.1 探索性因素分析的執行條件

需要檢查的第一個執行條件是**球形性*,這是檢查資料變項之間的相關性,相關的變項越多就可以用越少潛在因素解釋。巴特利球形檢驗是用來檢驗變項的相關矩陣，是否顯著不同於零相關矩陣。如果巴特利檢驗結果有達到顯著($p < .05$),表示反應變項之間有關聯性，可使用探索性因素分析。

第二個要檢查的執行條件是樣本適足性,這是使用Kaiser-Meyer-Olkin樣本適足量數(簡稱KMO)做為評估指標。KMO樣本適足量數代表觀察變項之間的共變佔總變異量的比例。因為通常報告呈現的潛在因素，很少納入只能解釋兩個變項的因素，因為這代表樣本不足。如果存在只影響兩個變項的因素，可計算部分相關係數。如果 KMO 量數偏高($ $),可認定因素分析結果有效;如果 KMO 量數偏低($ $),則因素分析結果找到的潛在因素與變項不相關。 KMO 量數小於 $0.5$ 表示因素分析結果不適用,KMO 值為 $0.6$ 時才會認定因素分析結果是低度適用。 $0.5$ 和 $0.7$ 之間的值被認為是中度適用,$0.7$ 和 $0.9$ 之間的值是高度適用,$0.9$ 和 $1.0$ 之間的值是非常適用。

15.1.2 探索性因素分析的用途

如果因素分析結果確立了適用的因素模型,接著需要決定如何處理結果顯現的新因素。EFA通常用來開發心理測量量表，研究人員會先建立與單一與多種心理特質有關的問卷題庫，收集次料後 EFA 檢視哪些題目是”聚斂於”一種潛在因素,然後評估是否應刪除沒有清楚測出任何一個潛在因素的某些題目。

EFA的另一種用途是將因素負荷量高的變項合併為因素分數,有時可稱為量表分數。有兩種方法能將合併的變項資料轉為量表分數 :

創建新變項代表要計分的因素，合併為一份量表的變項分數按照因素負荷量加權調整。
創建新變項代表要計分的因素，合併為一份量表的變項分數均權調整。

第一種方法的每個變項對合併分數的貢獻取決於與因素的關係強度。第二種方法就是拿所有受到同一因素實質影響的變項，取變項平均值做為合併的量表分數。何種方法較好沒有參考標準，只是第一種方法的缺點是因素負荷量會隨樣本檢源改變。行為和健康科學的研究人員經常會開發和使用於不同研究場景，或不同對象的綜合問卷。這種問卷的量表分數適合用第二種方法較合理，因為是基於等量貢獻的實質變項，而不是使用來自不同來源的特定樣本的負荷量加權。其實在任何研究問題，用變項平均值當成合併變項的測量較簡單，而且比較直觀。

還有一種使用迴歸式建立因素模型的進階方法，這是使用潛在因素預測其他潛在因素。這種方法就是“結構方式模型”(structural equation modelling)，已經有專門的軟體和R套件能執行這種方法。不過讀者還不必急著去學，現在先學好如何用 jamovi 執行 EFA。

15.1.3 使用jamovi完成探索性因素分析

圖 15.2 是取自國際性格量表題庫的25項自我報告題目，所組成的網路性格問卷–合成孔徑性格量表(SAPA:http://sapa-project.org)，其中一部分資料做為範例。25個題目假設受五個因素影響:親和性(Agreeableness)、盡責性(Conscientiousness)、外向性(Extraversion)、神經質(Neuroticism)和開放性(Openness)。

每個題目都是讓參與者用6點量表選出分數，代表題目描述與自我認知的適切程度:

1.非常不準確

2.中度不準確

3.輕度不準確

4.輕度準確

5.中度準確

6.非常準確。

圖 15.2: 資料檔案bfi_sample.csv的25個假設可測量五大性格因素的題目

示範資料Personality Questionnaire包括$N=250$份參與者樣本。研究人員會有興趣的，是檔案裡的$25$個觀察變項，有那些能合理測量的潛在因素。開啟這份檔案後，研究人員會先檢查這$25$個變項是否以連續變項編碼？如果不是，至少要用次序變項編碼，雖然jamovi的EFA模組可以處理類別變項。若是要用因素負荷加權計算因素分數，就需要先轉換為連續變項。

接著執行jamovi的EFA模組：

從主要jamovi模組選單選擇“因素”(factor)- “探索性因素分析”(Exploratory Factor Analysis)，開啟EFA分析視窗(圖 15.3)。
選擇25個性格量表題目變項，移到“變項”對話框。
勾選適當的選項,包括“適用條件檢查”(Assumption Checks)，建議設定“轉軸”(Rotation)的方法、要提取的“因子數量”(Number of Factors)和“其他輸出”(Additional Output)。執行EFA的建議勾選項目,可參考圖 15.3 。請注意稍後的說明，研究人員通常會在分析過程調整“轉軸”方法和提取的“因子數量”，以找到最佳結果。

我們首先檢查預設條件。從圖 15.4 可以看到(1)巴特利球形性檢定顯著,所以滿足這個預設條件;和(2)所有題目的取樣適切度性(MSA)指標KMO平均值為$0.81$(Overall)，代表這份樣本有很好的取樣適切度。這樣的設定沒有要進一步考慮的問題!

下一步要檢查的是要使用多少因素，或者說，要從資料中“提取”多少因素。有三種可行的方法:

選擇所有特徵值(Eigenvalue)大於1的組合，這樣會得到四項因素。
檢查斜率圖 (Scree plot, 圖 15.5) 可以幫助我們識別“屈折點”。這是斜率圖的曲線“彎頭”，明顯趨於平緩的點，如此我們會得到五項因素。解釋斜率圖需要一些美學技巧:從圖 15.5 可以看到$5$到$6$之間有一個明顯的跨度，但是多數案例看到的斜率圖，通常不會那麼清晰。
使用平行分析技術，比較從全部資料獲得的特徵值與從部分隨機資料獲得的特徵值。如果前者的特徵值大於後者的特徵值，就以該特徵決定要提取的因素數量。

圖 15.5: 在jamovi EFA 中顯示人格資料的斜率圖,顯示在點5(“肘部”)后明顯拐點和趨於平緩

根據 Fabrigar et al. (1999) 的說法，第三種方法最好,儘管執行統計實務的研究人員，都會查看所有三個方法，然後根據最容易或最好解釋的因素數量來做判斷。這種方式可稱為“意義標準”，研究人員通常除了運用一種較合理的方案外,還會嘗試可以提取多一兩個或少一兩個因素的方案，然後再採用對研究結論來說，最有意義的方案。

同時,我們還要決定最佳的轉軸方法。主要有兩種:正交(varimax)強制設定入選因素無相關，斜交(oblimin)允許入選因素之間有相關。心理學家和行為科學家感興趣的因素通常並非正交，因此斜交是較合理的方法²。

在一般的統計實務，如果用斜交轉軸發現因素之間存在顯著相關，大約是相關係數絕對值大於0.3，如同圖 15.6 的因素間相關係數表所示，其中兩個因素之間的相關係數是0.31，這表示採用斜交轉軸直覺沒錯。如果這些因素確實有相關，斜交轉軸得到的因素結構和估計值是比正交轉軸更好也更簡單。而且，如果斜交轉軸顯示各因素之間的相關接近零，研究人員就採用正交轉軸的分析結果，因為兩種轉軸方法給出的結論大致一致。

圖 15.6 顯示提取的五個因素之間，至少有一組的相關係數大於0.3，因此我們傾向採納五個因素的斜交轉軸。圖 15.6 的總結表格也顯示五個因素能解釋全部資料變異量比例為46%。因素一能解釋大約10%的變異，因素二、三、四各自能解釋大約9%的變異，因素五能解釋略多於7%的變異。這其實並不理想，一般會期待提取因素能解釋的變異比例越高越好。

請注意執行探索性因素分析的研究人員，可以預期能提取的因素數量等於觀察變項數量，而且增加一個因素，都會小幅增加解釋變異的比例。如果只用少數因素就能解釋25個觀察變項的高比例變異，這些因素顯然是25個觀察變項的可用替代變異。只要能解釋最多比例的原始變異，研究人員可以不必顧慮未能解釋的其餘變異。不過，如果需要提取18個因素，才能解釋25個觀察變項的多數變異，那麼不如直接使用25個變項解釋資料。

圖 15.7 是因素負荷量統計表，顯示25道性格量表題目在五個因素的負荷量。在圖 15.3 的設定視窗，已經設定隱藏小於0.3的負荷量。

因素1、2、3、4的負荷量分佈模式，基本上與圖 15.2 的題組設定一致，而且因素5也很接近！假設是測量“開放性”的五個觀察變項，其中四個的因素5負荷量絕對值大於0.3，但是題組的第四題$04$似乎不符合預期，因為這題在因素4的負荷量高於0.3，雖然沒有高，但是在因素5的負荷量低於0.3。

另外需要注意的是，圖 15.2 題組摘要有標記“R:反向編碼”的題目，在負荷量統計表中的數值是負的。像是$A1$(“漠不關心他人的感受”)和$A2$(“詢問他人的幸福”)，$A1$的分數越高，代表親和力越低，$A2$與其他同組題目的分數越高，表示親和力越高。所以$A1$與其他題目是負相關，導致圖 15.7 的數值是負的。

我們也可以在圖 15.7 中看到每個變項的“獨特性”。獨特性是指變項中“獨特”的變異比例,而不是被因子所描述的 ³。例如,“A1”中有 72% 的變異沒有被五因子解中的因子描述。相反,“N1”的無法被因子解描述的變異相對較低(35%)。請注意,“獨特性”越高,該變項在因子模式中的相關性或貢獻越低。

說實話,在探索性因子分析中得到這樣整潔的解決方案並不尋常。結果通常會混亂得多,而解析因子的意義也更具挑戰性。很少會有這樣清晰劃分的變項池。您會有大量的反應變項,您認為它們可能是少數潛在因子的指標,但是您並不如此強烈地知道哪些變項將會到哪裡!

所以,我們似乎有一個相當好的五因子解,儘管它描述了相對較低的整體變異比例。假設我們對這個解決方案滿意,並希望在進一步分析中使用因子。直接的選擇是計算每個因子的整體平均分數。例如,對於資料集中的每個人的親和力因子,這涉及添加 $A1 + A2 + A3 + A4 + A5$,然後除以 5 ⁴。我們計算的因子得分是基於每個包含變項的等權得分。我們可以通過兩個步驟在 jamovi 中執行:

使用 jamovi 將 A1 重新編碼為 “A1R”,方法是反向評分變項中的值。
使用 jamovi 計算新變項 “親和力”,方法是計算 A1R、A2、A3、A4 和 A5 的平均值。

另一個選擇是創建一個最佳加權的因子分數指數。要做到這一點,使用“保存” - “因子分數”複選框將因子分數保存到資料集。一旦您這樣做,您將看到已經向資料添加了5個新變項(列),每個提取的因子一列。請參見@fig-fig15-10和圖 15.11。

圖 15.10: 使用“Bartlett”最佳加權方法的五因子解的因子分數選項的jamovi

現在,您可以繼續開展進一步的分析,使用基於平均分數的因子量表(例如@fig-fig15-9中的量表)或使用jamovi計算的最佳加權因子分數。由您選擇!例如,您可能想做的一件事是查看這些人格特徵中的每一項在性別上的差異。我們對計算的親和力分數使用平均分法進行了t檢驗圖(圖 15.12),結果顯示男性的親和力低於女性,但這個差異並不顯著(Mann-Whitney U = 5768,p = .075)。

15.1.4 探索性因素分析的報告須知

希望讀者現在已經了解如何使用jamovi 執行探索性因素分析。接下來,完成探索性因素分析後,報告要如何撰寫呢?其實並沒有標準的探索性因素分析報告格式，不同領域或學術社群各有習慣的範例。在此只介紹因素分析報告應包含的資訊：

你目前的研究所遵循的理論基礎,特別是透過探索性因素分析而發現的理論建構。
描述樣本資訊(例如人口統計訊息、樣本量、取樣方法)。
描述資料類型(例如名義變項、連續變項)以及描述統計資訊。
描述執行探索性因素分析的條件。尤其是球形假設檢定以及樣本適足性檢定的詳細資訊。
描述提取潛在因素的方法(例如“最小殘差法”或“最大似然法”)。
描述決定因素數目以及題目的標準和過程。建議清楚說明探索性因素分析過程每個決定的理由。
描述所使用的轉軸方法、原因以及結果。
整理最後算出的因素負荷量於報告的表格中。表格內容的最後一列應報告每個變項的獨特性(或公因性)。除了項目編號,因素負荷量還要附上描述性標籤。因素之間的相關係數也應呈現於表格內,無論是在總表格的底部或單獨製表。
為決定提取的潛在因素取個有意義的名稱。可以是預先選定的名稱,檢視有效的題目與最後提取的因素後,可以更換為更合適的名稱。

15.2 主成分分析

探索性因素分析一節示範如何決定影響題目變項的潛在因素。範例也說明在某些情況，有較少的因素的變項結構，有利使用綜合的因素分數做進一步的統計分析中。

這種方法被稱為“資料降維”，除了探索性因素分析，研究者也可以用主成分分析(principal component analysis, PCA)做“資料降維”。不過，PCA並是不用來辨識潛在因素,而是從更大的測量變項集合建立線性綜合分數。

PCA只是產生原始資料的數學轉換,並不限制變項之間必須存在共變。目的是計算原始變項的幾種可能線性組合,這些組件可以用來總結收集的資料,且幾乎不丟失任何資訊。然而,如果分析的目的是辨識潛在的變項結構,那麼應該使用探索性因素分析。正如探索性因素分析的範例,此方法產生的因素分數與主成分分析一樣可以達到資料降維 (Fabrigar et al., 1999)。

因為過去使用計算機並不容易，上個世紀的心理學研究很流行使用PCA，所以在此介紹一下。如今各型電腦的計算能力越來越強大，使得研究者完成探索性因素分析時間成本大幅降低,而且與PCA相比,特別是在因素和變項數量較少的情況,探索性因素分析更能避免誤差。PCA的大部分程序與探索性因素分析相似,所以儘管執行條件有一些差異,但是實際操作步驟是相同的,並且對於足夠大的樣本以及充分數量的因素和變項,PCA和EFA的結果應該差不多。

要使用jamovi執行PCA,只要從主界面按鈕欄選擇“因子” - “主成分分析”以打開PCA分析視窗。然後,您可以遵循使用jamovi完成探索性因素分析的示範步驟，就能完成PCA。

15.3 驗證性因素分析

使用精選自國際性格量表題庫的網路問卷資料來確定人類性格的潛在因素似乎相當有效。開發可用的性格測量工具的下一步，是招募不同樣本檢驗從探索性因素分析確定的潛在因素。研究人員想知道能否用另一批資料驗證這些因素,為了進行驗證,研究人員需要一個更嚴格的方法，也就是這一節介紹的驗證性因素分析(CFA)。這種因素分析是開發出來確認預先指定的潛在因素結構。 ⁵

執行CFA不會用探索性的方式查看資料的整合方式,而是像圖 15.13 所示先建立一套因素結構，查看資料符合我們預先指定的結構的程度。研究人員使用CFA時的主要目的，是想要查看反應資料對預先指定的模型的確認程度。

直接對這些性格題目資料進行確證性因素分析將如圖 15.13 所示指定五個潛在因素,每個因素各以五個反應變項測量，每個變項被認定是潛在因素的測量尺度之一。例如,題目A1的反應可被潛在因素「親和力」預測，然而因為A1不能完美測量親和力,所以變項的變異還包括一個誤差項$e$。換句話說,$e$代表了A1中無法被親和力因子預測的變異，這個部分又被稱為測量誤差。

圖 15.13: 根據預先指定的潛在因素結構，使用確認性因素分析檢驗五大性格特徵量表題目與影響因素。

接著要考慮模型裡的潛在因素是否應該有相關性。如同探索性因素分析的範例，心理和行為科學的模型經常有彼此相關的因素，心理學家也同意各種性格特徵可能互有關聯。因此五大人格的模型裡，也包括潛在因素之間的共變，如同圖 15.13 中串連各潛在因素的雙向箭頭。

研究人員同時要考慮某些測量誤差因為任何合理的、有系統性的理由而互有相關。如此設定的一個原因可能是有幾種反應變項之間存在共變的測量誤差,以致反應變項之間的相關可能是出於研究方法造成的系統誤差，而非與潛在變項的關聯性。下一節多種特質多項相關驗證性因素分析介紹的進階方法將討論如何處理這種可能性,目前因為沒有任何明確的理由確認某些誤差項彼此相關，因此先不討論。

如果沒有必要檢查誤差項之間的相關,研究人員只要檢測圖 15.13 所指定的因素結構，與反應資料的匹配程度。由於預期只有模型裡的因素才能由資料變項提取，所以與模型內因素及變項無關的係數都被設置為零，例如,A1的原始資料與潛在因素「外向性」有高負荷量,但在是要驗證的模型假設此係數為零。如果與模型無關的係數不為零，確認性因素分析結果可能會顯示模型與資料之間的匹配程度不高。

接著來看看如何使用jamovi設定確認性因素分析的報行參數。

15.3.1 使用jamovi完成驗證性因素分析

打開 bfi_sample2.csv 文件,檢查25個變項是否被編碼為順序變項(或連續變項;對於這個分析不會產生任何區別)。要在jamovi中執行確認性因素分析:

從主界面按鈕欄中選擇“因子” - “確認性因素分析”以打開確認性因素分析窗口(圖 15.14)。
在“因子”框中選擇5個A變項並將其轉移到“因子”框中,並給予“親和力”的標籤。
在“因子”框中創建一個新的因子並給它貼上“盡責性”的標籤。選擇5個C變項並將其轉移到“盡責性”標籤下的“因子”框中。
在“因子”框中再創建一個新的因子並給它貼上“外向性”的標籤。選擇5個E變項並將其轉移到“外向性”標籤下的“因子”框中。
在“因子”框中再創建一個新的因子並給它貼上“神經質”的標籤。選擇5個N變項並將其轉移到“神經質”標籤下的“因子”框中。
在“因子”框中再創建一個新的因子並給它貼上“開放性”的標籤。選擇5個O變項並將其轉移到“開放性”標籤下的“因子”框中。
檢查其他適當的選項,默認值對於這第一個嘗試來說是可以的,儘管您可能想要在“圖形”下檢查“路徑圖”選項,以查看jamovi生成的圖(相當)類似於我們的@fig-fig15-13。

設定好分析後,我們可以將注意力轉到jamovi的結果窗口,看看情況如何。首先要看的是模型適配度(圖 15.15),因為這告訴了我們模型與反應資料的匹配程度。請注意,在我們的模型中,只估計了預先指定的協方差,默認包括因子相關。其餘都設置為零。

有幾種方法可以評估模型的適配度。第一個是卡方統計量,如果很小,則表示模型與資料的匹配很好。然而,用於評估模型適配的卡方統計對樣本大小相當敏感,這意味著對於大樣本而言,模型與資料之間足夠好的匹配幾乎總會產生很大的顯著($p$ < .05)卡方值。

因此,我們需要其他的模型適配度評估方法。在 jamovi 中預設提供了幾種。這些是比較適配指數(CFI)、塔克-劉易斯指數(TLI)和近似誤差均方根(RMSEA)以及 RMSEA 的 90%置信區間。一些實用的經驗法則是,CFI > 0.9、TLI > 0.9和 RMSEA 約為 0.05 到 0.08 表示滿意的適配。CFI > 0.95、TLI > 0.95和 RMSEA 及 RMSEA 上界 CI < 0.05 表示很好的適配。

所以,看@fig-fig15-15我們可以看到,卡方值很大並且顯著性很高。我們的樣本量不大,所以這可能表示模型適配較差。CFI為$0.762$,TLI為0.731,表示模型與資料之間的匹配較差。RMSEA為$0.085$,90%置信區間從$0.077$到$0.092$,同樣也沒有顯示很好的適配。

這個結果相當令人失望,不是嗎?但考慮到在前一節的 EFA 分析中,當我們使用類似的資料集(見探索性因素分析)運行時,五因子模型只描述了資料中的大約一半變異,這結果可能也不太令人驚訝。

讓我們繼續查看@fig-fig15-16和?fig-fig15-17中顯示的因子加載量和因子協方差估計。每個參數的 Z 統計量和 P 值表明他們對模型做出了合理的貢獻(即它們不為零),所以沒有任何理由從模型中刪除任何指定的變項-因子路徑或因子-因子相關。通常標準化估計值更容易解釋,這些可以在“估計”選項下指定。這些表可以用fully併入書面報告或科學文章中。

我們如何改進模型呢?一個選擇是返回幾個階段並重新考慮我們正在使用的項目/測量以及如何改進或更改它們。另一種選擇是對模型進行一些事後調整以改進適配度。實現這一目的的一種方法是使用“修正指數”(圖 15.18),在 jamovi 中它被指定為“其他輸出”選項。

我們要尋找的是最大修正指數(MI)值。然後,我們將判斷是否有理由將該附加項添加到模型中,使用事後合理化。例如,我們可以在@fig-fig15-18中看到,在模型中還沒有的因子加載量中,最大的 MI 值是 N4(“經常感到沮喪”)加載到潛在因子外向性上的值 28.786。這表明如果我們將此路徑添加到模型中,卡方值將減少差不多相同的量。

但是在我們的模型中增加這條路徑在理論上或方法論上並不合理,所以這並不是一個好主意(除非您能提出有說服力的論據認為“經常感到沮喪”同時測量神經質和外向性)。我想不出好的理由。但是,為了論證的目的,讓我們假裝確實有一定的意義並將此路徑添加到模型中。返回確認性因素分析窗口(圖 15.14)並將 N4 添加到外向性因子中。 CFA 的結果現在會改變(未顯示); 卡方下降到約 709 左右(下降了約 30,大致與 MI 的大小相當),其他適配指標也有所改善,儘管只是一點點。但這還不夠:這仍然不是一個很好的匹配模型。

如果您發現自己正在使用 MI 值向模型中添加新的參數,則每次新增後都應重新檢查 MI 表,因為 MI 會在每次重新計算。

jamovi 還產生了殘差協方差修正指數表(圖 15.19)。換句話說,如果將這些相關誤差添加到模型中,那麼這是一個顯示哪些相關誤差可以最大程度改進模型適配的表格。同時查看這兩個 MI 表是一個好主意,找出最大的 MI,考慮是否可以合理證明建議參數的增加,如果可以的話,將其添加到模型中。然後,您可以在重新計算的結果中再次開始尋找最大的 MI。

您可以盡可能長時間以這種方式繼續操作——根據最大的 MI 將參數添加到模型中,最終您將實現令人滿意的適配效果。但這樣做的強大可能性是您將創建一個怪物!一個醜陋、畸形的模型,在理論上毫無意義或純粹性。換句話說,要非常小心!

到目前為止,我們已經使用第二個樣本和確認性因素分析檢查了在探索性因素分析中獲得的因子結構。不幸的是,我們發現探索性因素分析中的因子結構在確認性因素分析中沒有被確認,所以就這個人格特徵量表的開發而言,我們又回到了起點。

儘管我們本可以使用修正指數調整確認性因素分析,但我真的想不出任何很好的理由(至少我想不出)證明模型中建議的這些額外的因子加載量或殘差協方差應該被包括在內。然而,在某些情況下,允許殘差共變(或相關)是有很好理由的,下一節多種特質多項相關驗證性因素分析就給出了一個很好的例子。在進入下一部分之前,讓我們先了解如何報告確認性因素分析的結果。

15.3.2 驗證性因素分析的報告須知

確認性因素分析報告沒有正式的標準格試,不同領域或學術社群的報告範例也有所不同。儘管如此,建議報告裡應包括以下幾項:

描述假設模型的理論和實證依據。
完整描述模型內的因素關聯性(例如,每個潛在因素的影響變項,潛在變項之間的共變異數，以及任何誤差項之間的相關係數)。以圖 15.13 這樣的路徑圖呈現在報告是種清楚的報告方法。
描述樣本資訊(例如人口統計資訊、樣本量、取樣方法)。
描述資料類型(例如名義變項、連續變項)以及完整的描述統計。
描述使用條件的檢驗方法，以及關鍵係數的估計方法。
描述缺失資料的來源以及處理方式。
測試模型適配度的軟體和版本。
判斷模型適配度的測量尺度和標準。
基於模型適配度或修正指數所進行的模型變更。
以表格整理所有參數估計值(因素負荷量、誤差變異數、潛在變異數或共變數)及其標準誤。

15.4 多種特質多項相關驗證性因素分析

這一節介紹的因素分析方法將考慮方法變異，也就是來自不同的測量尺度或題目所形成的資料變異。所以這一節的範例採用另一個包含“歸因風格”的資料檔案。

Hewitt et al. (2004) 歸因風格問卷(ASQ)從英國和紐西蘭的年輕人收集心理健康資料，他們測量了負面事件的歸因風格,這是指每個人有自行解釋壞事如何發生的歸因類型(Peterson & Seligman, 1984)。言份問卷測量三種歸因風格:

內隱性(Internality)是他/她相信壞事發生是個人行為造成的程度。
穩定性(Stability)是指他/她習慣地認為隔一段時間就會發生壞事的程度。
全局性(Globality)是指他/她習慣地認為導致一件壞事的原因會影響個人生活各層面的程度。

問卷設定六種假設情境,對於每種情境,受測者要根據情境設定，回答一組問題,回答是用於測量(a)內隱性,(b)穩定性和(c)全局性。所以要填的問題總共有$6 \times 3 = 18$個。英文版問卷內容請參考圖 15.20 。

研究人員想要分析他們收集的資料,評估ASQ的18個反應變項是否確實測量到有興趣的潛在因素。

首先,他們使用探索性因素分析,但嘗試各種因素選取或轉軸方法,都找不到一個好的因素結構，因此沒有得到可靠的結論。像這樣的狀況，要麼研究人員的理論是錯誤的(歸因風格可能不是潛在因素),要麼選取到不相關的樣本(樣本規模和特徵可能不是英國和紐西蘭的年輕人),要麼分析方法不是解決這項研究問題的合適工具。在此我們探研第三種可能性。

我們先將ASQ測量的三種歸因：內隱性、穩定性和全局性，還有各情境的六項題目測量資料的關聯性，以圖 15.21 的路徑圖呈現。

如果研究人員不用探索性的分析方法找出資料變項的組合，而是預先設定如同圖 15.21 的因素及變項結構,那要如何檢驗資料符合這套結構的程度？這樣的分析角度是一種確認性分析,重點是檢視原始資料適配預先指定模型的程度。實際使用ASQ資料執行確證性因素分析，要先確認每位受測者有如同圖 15.27 所列的18項反應資料，三個因素各有六個測量變項。

圖 15.21: ASQ包括的三個潛在因素~內隱性、穩定性和全局性及對應的六道題目編碼

每個變項與潛在因素可以描繪成圖 15.22 的路徑圖。例如,INT1受到潛在因素內隱性影響，並且因為INT1無法完美測量內隱性,所以還有誤差項$e_1$。換句話說,$e_1$代表INT1無法被內隱性解釋的變異，這種誤差又被稱為“測量誤差”。

接著要考慮模型裡的潛在因素是否應該有相關性。如同探索性因素分析的範例，心理和行為科學的模型經常有彼此相關的因素，使用ASQ的研究人員也同意內隱性、穩定性和全局性可能互有關聯。因此圖 15.23 展示的模型還包括潛在因素之間的共變，以串連各潛在因素的雙向箭頭表示。

圖 15.23 還有呈現共用方法誤差之間的相關性，也就是INT1, STAB1 與 GLOB1 三個項目誤差項之間的雙向箭頭。為了保持視覺簡潔，其他誤差異的相關性就予以省略。

圖 15.23: 進行CFA MTMM分析前，預先假設的ASQ 潛在因素結構最終版,包括潛在因素之間相關、以及反應變項INT1、STAB1和GLOB1的共享方法誤差之間相關。為清楚起見,未呈現其他預先指定的誤差項相關。

研究人員同時要考慮某些測量誤差因為任何合理的、有系統性的理由而互有相關。仔細看一下ASQ的題目,每個主要題目(1-6)都有三個子題(a、b和c)。Q1與找不到工作有關,這個問題與其他問題(2-5)相比,在找工作方面可能具有某些獨特的人為或方法論特性。同樣地,Q2與不幫助朋友解決問題有關,在不幫助朋友這一點上,與其他問題(1和3-5)相比可能存在某些獨特的人為或方法特性。

因此,除了不只一個因素,ASQ還有多種方法特性,其中每個主要題目都有特定的“測量方法”,但是每種“測量方法”貫穿a、b和c子題。為了將不同方法特性納入模型,研究人員會指定某些誤差項彼此相關。例如,INT1、STAB1和GLOB1的誤差項應該彼此相關,代表Q1a、Q1b和Q1c各自的方法誤差有共變。

儘管可以用如同圖 15.22 的基本CFA模型檢驗資料,但這裡設計一個更複雜的模型,如同圖 15.23 的模型所示。這種更複雜的CFA模型被稱為多種特質多項相關(MTMM)模型,以下示範如何使用jamovi執行。

15.4.1 使用jamovi完成多種特質多項相關驗證性因素分析

打開 ASQ.csv 文件並檢查18個變項(6個“內隱性”、6個“穩定性”和6個“全局性”變項)是否被指定為連續變項。

要在jamovi中執行多特徵多方法確認性因素分析:

從主界面按鈕欄中選擇“因子” - “確認性因素分析”以打開確認性因素分析窗口(圖 15.24)。
在“因子”框中選擇6個INT變項並將其轉移到“因子”框中,並給予“內隱性”的標籤。
在“因子”框中創建一個新的因子並給它貼上“穩定性”的標籤。選擇6個STAB變項並將其轉移到“穩定性”標籤下的“因子”框中。
在“因子”框中再創建一個新的因子並給它貼上“全局性”的標籤。選擇6個GLOB變項並將其轉移到“全局性”標籤下的“因子”框中。
打開殘差協方差選項,並對於每個預先指定的相關,將相關的變項移動到右側的“殘差協方差”框中。例如,同時突出顯示INT1和STAB1,然後單擊箭頭將其移動。現在對INT1和GLOB1、STAB1和GLOB1、INT2和STAB2、INT2和GLOB2、STAB2和GLOB2、INT3和STAB3等執行相同操作。
檢查其他適當的選項,默認值對於這第一個嘗試來說是可以的,儘管您可能想要在“圖形”下檢查“路徑圖”選項,以查看jamovi生成的圖(相當)類似於我們的@fig-fig15-23,並包括我們上面添加的所有誤差項相關。

一旦設定好分析,我們就可以把注意力轉到jamovi的結果窗口,看看狀況如何。首先要看的是“模型適配度”,因為這告訴了我們模型與反應資料的匹配程度(圖 15.25)。請注意,在我們的模型中,只估計了預先指定的協方差,其他都是設定為零,所以模型適配度測試的是預先指定的“自由”參數是否不為零,反過來是否資料中的其他關係——那些我們沒有在模型中指定的關係——可以保持為零。

看@fig-fig15-25我們可以看到,卡方值非常顯著,考慮到樣本量很大(N = 2748)這一點就不足為奇了。 CFI為0.98,TLI也為0.98,表示模型適配非常好。 RMSEA為0.02,90%置信區間從0.02到0.02,非常緊密!

總的來說,我認為我們可以滿意地認為我們預先指定的模型與反應資料的匹配非常好,這支持了我們對ASQ的MTMM模型。

現在我們可以繼續查看因子加載量和因子協方差估計,如@fig-fig15-26所示。通常標準化估計值更容易解釋,這些可以在“估計”選項下指定。這些表可以很好地併入書面報告或科學文章中。

從@fig-fig15-26您可以看到,我們預先指定的所有因子加載量和因子協方差明顯不同於零。換句話說,它們似乎都在為模型做出有用的貢獻。

在這次分析中,我們相當幸運,在第一次嘗試就得到了非常好的適配效果!

15.5 內部一致性信度分析

初步了解運用探索性因素分析和確認性因素分析開發量表的過程後,現在對運用因素分析的認識應該到達了新階段:有效的量表利用不同樣本的確認性因素分析會得到一致的結果。到了這個階段,也許會想知道使用反應變項組合的量表所測得的因素分數有多可信。

心理測量常使用可靠性分析評估心理建構的測量一致性資訊(印象模糊的話，請複習一下小單元 2.3 )。這裡要討論的是內部一致性,這是指組成一個量表的所有題目之間一致性。比如有 $V_1、V_2、V_3、V_4$ 和 $V_5$ 等反應變項,就可以計算一個統計量,以此評估這些變項在測量潛在因素的內部一致性。

克隆巴赫$\alpha$係數是最常被用來檢驗量表內部一致性的統計量(Chronbach, 1951)。克隆巴赫$\alpha$是一種評估測量等價性的指標(不同量表的題目產生相同測量結果的程度)。驗證測量等價性的方法是將量表項目分半,查看各半的分析結果是否具有可比性。同一套題目的題目有多種分半方式,如果比較所有的分半分析結果,就會得到一個反映整體分半等價係數的統計量。克隆巴赫$\alpha$就是這樣一種統計量:綜合一個量表的所有項目分半係數的函數。如果一組測量一個構建的項目(例如外向性量表)的 $\alpha$ 為 $0.80$,那麼該量表的誤差變異比例為 $0.20$。換句話說,$\alpha$ 為 $0.80$ 的量表包括大約 20% 的誤差。

, 但是，克隆巴赫$\alpha$不是單維性測量值(指係數呈現單一量表只測量單一因子或構建，而不是測量複數構建)。如果一份量表不只評估一種因素，得到的$\alpha$會是被低估的值。也就是說如果一份評估不只一種潛在因素的量表$\alpha$為0.80，這個量表的題目呈現的一致性不只反映在單一因素。這是為什麼本書建議先進行探索性因素分析或確認性因素分析的原因。

克隆巴赫$\alpha$的另一個特性是會呈現樣本特異性:不只是量表題目的內部一致性，而是樣本資料的特徵也會影響$\alpha$係數。有取樣偏誤、不具代表性或小樣本資料的$\alpha$係數，可能與有代表性的大樣本所測出的$\alpha$係數非常不同。即使是兩套樣本量相當的大型資料之間,$\alpha$也可能不一樣。儘管有這些使用限制,心理學領域一直很愛用克隆巴赫$\alpha$估計內部一致性。因為計算簡單、容易理解和解釋。研究者將量表用於不同樣本、不同環境或人群的施測,可以作為評估量表是否有用的初級指標。

另一種指標是麥當勞$\omega$，也可以用jamovi計算。使用$\alpha$有這些條件：(a)殘差項目之間沒有相關,(b)所有題目的因素負荷量相等,以及(c)量表只有測量單一因素。不過使用$\omega$沒有這些限制，因此是一種更穩健的內部一致性統計量。本書建議如果沒有上述使用條件，$\alpha$和$\omega$的值會相當接近；如果有違反，應優先採用$\omega$。

有的時候研究人員需要一套閾值，判斷$\alpha$或$\omega$夠不夠好。像是$\alpha$為$0.70$ 或 $0.80$ 分別代表量表內部一致性“可接受”及“良好”。更好的報告方法是呈現$\alpha$或$\omega$的值都是$0.70$，且量表測量誤差約佔30%；或者呈現$\alpha$或$\omega$的值都是$0.80$，且量表測量誤差約佔20%。

$\alpha$太高是不是好事？若是係數值大於$0.95$，表示量表題目之間有高相關，不過測量方法可能存在過度冗餘資訊導致的特異性,而且要測量的因素建構可能有過度窄化之風險。

15.5.1 使用jamovi完成內部一致性信度分析

您提醒得非常到位,文本中还存在简体词汇“變項”和“資料”。已经校对替换为“變項”和“資料”。譯文重新生成如下:

我們有第三個人格資料樣本可以用於進行可靠性分析:在 bfi_sample3.csv 檔中。再次檢查25個人格項目變項是否被編碼為連續變項。要在 jamovi 中執行可靠性分析:

從主界面按鈕欄中選擇“因子” - “可靠性分析”以打開可靠性分析窗口(圖 15.27)。
選擇5個A變項並將其轉移到“項目”框中。
在“反向計分項目”選項下,選擇“正常計分項目”框中的A1變項,並將其移動到“反向計分項目”框中。
檢查其他適當的選項,如@fig-fig15-27所示。

完成後,查看 jamovi 結果窗口。您應該看到類似圖 15.28 的內容。這告訴我們親和力量表的克隆巴赫 α 係數為 0.72。這意味著親和力量表分數中的錯誤變異略低於 30%。麥當勞 ω 也給出了,為 0.74,與 α 沒有太大區別。

我們也可以檢查如果從量表中刪除特定項目,α 或 ω 如何得到改善。例如,如果刪除項目 A1,α 將增加到 0.74,ω 增加到 0.75。這個增幅並不大,所以可能不值得這樣做。

計算和檢查量表統計量(α 和 ω)的過程對於所有其他量表也是相同的,除了開放性,它們都有類似的可靠性估計。對於開放性,量表分數中的錯誤變異量約為 40%,這很高,並表明與其他人格特徵量表相比,開放性作為人格特徵可靠測量的一致性要差得多。

15.6 本章小結

這一章我們學習因素分析的相關技術，特別是評估資料內各種相關性的方法。本章的學習重點包括：

探索性因素分析 (EFA)用於辨識資料內的潛在因素。根據因素負荷量，每個觀察變項都有可能代表某個潛在因素。研究者也會使用EFA簡化資料項目，像是使用序列分析整合數個觀察變項為一個因素。
主成分分析 (PCA)是一種簡化資料項目的技術，但是並非用於辨識潛在變項。PCA只是生成觀察變項的線性組合。
驗證性因素分析 (CFA)不同於EFA，執行前已經有一個理想的模型～也就是觀察變項之間的關聯模型。CFA的用途是檢測理想模性與資料模型的擬合度。
多種特質多項相關驗證性因素分析 (MTMM CFA) 用於分析潛在因素模型的方法不只一種，需要評估各種分析方法所所估計的變異合理程度。
內部一致性信度分析用於評估量表所測對象，與假設的心理建構之間的一致性程度。

因素負荷量的解讀方式如同標準化迴歸係數。↩︎
斜交轉軸會得出兩套因子矩陣,一個是結構矩陣(structure matrix ),另一個是模式矩陣(pattern matrix)。 jamovi的結果報表只會顯示模式矩陣,因為這種矩陣最能用於解釋分析結果,儘管一些專家建議兩套矩陣都有意義。結構矩陣顯示的是變項係數與因素之間的關係,但是設定因素之間的相關為零。模式矩陣除了顯示各因素與所有變項係數的相關性,也有顯示控制其他因素，特定因因素對所有變項的相關性，類似計算標準化迴歸係數。選擇正交轉軸的話,結構和模式矩陣的內容是相同的。↩︎
在因子分析中有時會報告“公因性”,這是變項中能夠被因子解描述的變異量。獨特性等於 (1 $\sim$ 公因性)↩︎
必要時先進行某些變項的反向計分↩︎
此外,若是研究人員對最初“假設”的因素結果相當有信心,可以9跳過EFA而直接進行CFA。要先使用EFA然後進行CFA,還是直接進行CFA,這在很大程度上取決於研究人員最初對模型準確性(就因素和變項數量來源)的判斷和信心。在量表開發的早期階段或確定潛在因素結構的時候,多數研究人員傾向使用EFA。接近完成最終版量表，或者想用新樣本檢查已建立的量表,CFA是一個不錯的選擇。↩︎