《用jamovi上手統計學》導讀

類別資料分析 10-1 ~ 10-5

類別資料分析使用時機及適用條件

依變項和獨變項都是名義尺度

  • 只有一個獨變項,評估獨變項對依變項的影響效果
  • 依變項次數紀錄彼此獨立
  • 各依變項數值出現次數至少大於5
  • 有兩個獨變項,評估變項之間的關聯性
  • 依變項次數紀錄彼此獨立
  • 各依變項數值出現次數至少大於5

適合度檢定範例

  • 人類的思維能做隨機想像嗎?
id choice_1 choice_2
“subj1” “spades” “clubs”
“subj2” “diamonds” “clubs”
“subj3” “hearts” “clubs”
“subj4” “spades” “clubs”
“subj5” “hearts” “spades”

卡方適合度檢定

  • \(O = (O_1, O_2, O_3, O_4) = (35, 51, 64, 50)\)
  • \(P = (P_1, P_2, P_3, P_4) = (.175, .205, .32, .25)\)
  • \(H_0: \text{ 四種花色被選擇的機率相等}\)
  • \(H_0: P = (.25, .25, .25, .25)\)
  • \(H_1: \text{ 至少有一個選擇花色的機率不是 0.25}\)
  • \(H_1: P \neq (.25, .25, .25, .25)\)
  • \(最小\alpha = .05, .01 ?\)
  • \(E_i = N \times P_i\)
  • \(N = 200\)
  • \(P = (P_1, P_2, P_3, P_4) = (.25, .25, .25, .25)\)
  • \(E = (E_1, E_2, E_3, E_4) = (50, 50, 50, 50)\)
  • \(E = (E_1, E_2, E_3, E_4) = (50, 50, 50, 50)\)
  • \(O = (35, 51, 64, 50)\)
  • 差異分數: \(O_i - E_i = (-15, 1, 14, 0)\)
  • \(\chi^2 = \sum( (O_i - E_i)^2 / E_i ) = 8.44\)
  • df = (每個參與者可以選擇的項目數量) - (可選出的數量) = k - 1

\(\chi^2 = \sum( (O_i - E_i)^2 / E_i ) = 8.44\)

  • df = 4 - 1 = 3

  • p = 0.04

\(\alpha\) .05 .01
臨界值 7.81 11.34
  • 尼曼版結論 vs. 費雪版結論?

獨立性檢定範例

疑似機器人 疑似人類
小狗 13 15
小花 30 13
數據 44 65
Total 87 93
疑似機器人 疑似人類
小狗 \(O_{11}\) \(O_{12}\)
小花 \(O_{21}\) \(O_{22}\)
數據 \(O_{31}\) \(O_{32}\)
Total \(C_1\) \(C_2\)

卡方獨立性檢定

兩類受測者回答各選項的人數比例是否相等?

疑似機器人 疑似人類 Total
小狗 \(E_{11}=\frac{R_1 \times C_1}{N}\) \(E_{12}=\frac{R_1 \times C_2}{N}\) \(R_1\)
小花 \(E_{21}=\frac{R_2 \times C_1}{N}\) \(E_{22}=\frac{R_2 \times C_2}{N}\) \(R_2\)
數據 \(E_{31}=\frac{R_3 \times C_1}{N}\) \(E_{32}=\frac{R_3 \times C_2}{N}\) \(R_3\)
Total \(C_1\) \(C_2\) N
  • \(E_{ij}=\frac{R_i \times C_j}{N}\)
  • \(H_0: \text{實驗結果符合以下三項:}\)
    • \(E_{11} = E_{12}\text{ (選擇“小狗”的次數相同)}\)
    • \(E_{21} = E_{22}\text{ (選擇“鮮花”的次數相同)}\)
    • \(E_{31} = E_{32}\text{ (選擇“資料”的次數相同)}\)
  • \(H_1: \text{實驗結果符合以下三項:}\)
    • \(E_{11} \neq E_{12}\text{ (選擇“小狗”的次數不相同)}\)
    • \(E_{21} \neq E_{22}\text{ (選擇“鮮花”的次數不相同)}\)
    • \(E_{31} \neq E_{32}\text{ (選擇“資料”的次數不相同)}\)
疑似機器人 疑似人類
小狗 O 13 15
E 13.53 14.47
小花 30 13 43
E 28.78 22.22
數據 44 65 109
E 52.68 56.32
Total 87 93 180
E 87.00 93.00

\(\chi^2=\sum_{i=1}^{r}\sum_{j=1}^{c} \frac{(E_{ij}-O_{ij})^2}{E_{ij}}\)

  • df = (一組參與者可選的項目數量 - 可選出的項目數) * (一個項目能被選擇的參與者分組 - 被選擇的參與者組數) = (r - 1)(c - 1)

\(\chi^2 = \sum_{i=1}^{r}\sum_{j=1}^{c} \frac{(E_{ij}-O_{ij})^2}{E_{ij}} = 10.72\)

  • df = (3 - 1)(2 - 1) = 2

  • p = 0.005

\(\alpha\) .05 .01
臨界值 5.99 9.21
  • 尼曼版結論 vs. 費雪版結論?

卡方統計值的校正及效果量

  • 葉氏修正:由於樣本資料是名義尺度變項,但是\(\chi^2\)分佈是連續變數。有需要的話,可勾選” \(\chi^2\) continuity correction”。
  • \(\phi\) ~ 2X2 列聯表; V ~ 3x3以上列聯表。可勾選”Phi and Cramer’s V”於報表輸出。