読者です 読者をやめる 読者になる 読者になる

Rを通じて統計学を学ぶ備忘録ブログ

SPSSからRに移行したい私のような人向けのR解説ブログ兼学習用備忘録。

第24回 カイ二乗検定とサンプルサイズのいけない関係

多変量解析

第24回 カイ二乗検定とサンプルサイズの関係について書きます。

small<-matrix(c(3,8,5,4),2,2)
small

colnames(small) <- c("like","dislike")
rownames(small) <- c("math","stat")

small

   like  dislike
math    3  5
stat    8   4

chisq.test(small,correct=FALSE)

Pearson's Chi-squared test

data: small
X-squared = 1.6498, df = 1, p-value = 0.199

互いの変数は「独立」であることがわかりました。ではサンプルサイズを各50倍しみましょう。

big <- small*50

rownames(big) <- c("math","stat")
colnames(big) <- c("like","dislike")
big

      like  dislike
math    150   250
stat    400   200

chisq.test(big,correct=FALSE)

Pearson's Chi-squared test

data: big
X-squared = 82.4916, df = 1, p-value < 2.2e-16

今回の検定では、互いの変数は「独立」でないことがわかりました。つまり、関連する。

標本の関係性が同じでも、サンプルサイズが大きくなると、検定は有意になりやすくなります。これは、カイ二乗検定だけに言えるものではなく、その他の検定でも成り立ちます。

広告を非表示にする