読者です 読者をやめる 読者になる 読者になる

Rを通じて統計学を学ぶ備忘録ブログ

SPSSからRに移行したい私のような人向けのR解説ブログ兼学習用備忘録。

第24回 カイ二乗検定とサンプルサイズのいけない関係

R 推測統計学

第24回 カイ二乗検定とサンプルサイズの関係について書きます。

 

> small<-matrix(c(3,8,5,4),2,2)
> small

> colnames(small) <- c("like","dislike")

> rownames(small) <- c("math","stat")

> small
   like  dislike
math  3  5
stat    8     4

> chisq.test(small,correct=FALSE)

Pearson's Chi-squared test

data: small
X-squared = 1.6498, df = 1, p-value = 0.199

 

互いの変数は「独立」であることがわかりました。

 ではサンプルサイズを各50倍しみましょう。

> big <- small*50

> rownames(big) <- c("math","stat")
> colnames(big) <- c("like","dislike")
> big
   like  dislike
math  150  250
stat    400 200

> chisq.test(big,correct=FALSE)

Pearson's Chi-squared test

data: big
X-squared = 82.4916, df = 1, p-value < 2.2e-16

 

今回の検定では、互いの変数は「独立」でないことがわかりました。つまり、関連する。

標本の関係性が同じでも、サンプルサイズが大きくなると、検定は有意になりやすくなります。これは、カイ二乗検定だけに言えるものではなく、その他の検定でも成り立ちます。 

広告を非表示にする