カイ二乗検定(独立性の検定)
カイ二乗分布を利用して行う検定のことをカイ二乗検定といい,カイ二乗検定には適合度の検定や独立性の検定がありますが,一般的にカイ二乗検定といったら独立性の検定を指します。独立性の検定とは度数の違いを確かめるための検定方法です。
カイ二乗検定は、、、
- 名義尺度のデータに適用できる
- ノンパラメトリック検定の1つである
- 度数の違いを確かめることができる
さて「度数の違いを確かめることができる」ということですが具体的にいうと,表-1(表中の*は度数です)のような分割表を作成したときにA要因とB要因が独立であるかどうかを確かめるわけです。つまり,A要因とB要因が独立であれば「関係はない」ということになり,逆にそれぞれの要因が独立でない場合は「関係がある」ということになるのです。
| B要因 | |
| A要因 | * * * * * * * * |
A要因とB要因は独立であるか?
⇒もし独立ならば,要因間に関係はない
⇒もし独立でないならば,要因間に関係がある
帰無仮説H0
⇒A要因とB要因は独立である
例 題
よく女性は占いが好きだというが,男性と比べた場合に本当に女性の方が占いが好きであるといえるだろうか。
| 好き | 嫌い | 計 | |
| 男性 | 23 | 27 | 50 |
| 女性 | 41 | 9 | 50 |
| 計 | 64 | 36 | 100 |
解 説
この場合において,性別がA要因,占いの好き嫌いがB要因ですが,性別(A要因)と占いの好き嫌い(B要因)は独立であるかどうかを考えるわけです。もし性別と占いの好き嫌いが独立であればそれらの要因間に関係はないわけですから,女性だからといって占いが好きだあるとは限らないということがいえます。逆にもし性別と占いの好き嫌いが独立でなければ,それらの要因間には関係があるということがいえるので,女性のほうが占いが好きだというのは本当であるようだということがいえるわけです。つまり帰無仮説は次のようにおける。
H0:性別と占いの好き嫌いは独立である
では実際に計算してみると(以下はRの実行結果です),(カイ自乗値)=12.5434,(自由度)=1,(p値)=0.0003976,となります。カイ自乗値(つまりこれはパーセント点)で判断する場合はカイ二乗分布表からχ21,0.05=3.841という値を拾ってきて,求めたカイ自乗値と比べればよいのです。あるいはp値(つまりこれは上側確率(面積))で判断する場合は求めたp値が0.05より小さいかどうかをみればよいのです。
> dat<-matrix(c(23,41,27,9),ncol=2)
> dat
[,1] [,2]
[1,] 23 27
[2,] 41 9
> chisq.test(dat)
Pearson's Chi-squared test with Yates' continuity correction
data: dat
X-squared = 12.5434, df = 1, p-value = 0.0003976
☆カイ自乗値(パーセント点)で判断する場合、、、
χ20=12.5434>χ21,0.05=3.841 ・・・求めたカイ自乗値の方が大きいので「A要因とB要因は独立である」という帰無仮説を棄却できる
☆p値(上側確率(面積))で判断する場合、、、
p=0.0003976<0.05 ・・・求めたp値の方が小さいので「A要因とB要因は独立である」という帰無仮説を棄却できる
したがって,女性の方が占い好きであるというのは本当のようであることが分かった。