読者です 読者をやめる 読者になる 読者になる

Rを通じて統計学を学ぶ備忘録ブログ

SPSSからRに移行したい私のような人向けのR解説ブログ兼学習用備忘録。

第42回 仮説検定

R 仮設検定 基本

第42回は検定について書きます。仮説検定では、「差がある」「差がない」、「薬の影響がある」「薬の影響がない」というように、仮説を設定します。その際に、帰無仮説は基本的に、「主張したいこと」の反対のものを設定します。???って初めはなりますが、順に見ていきましょう。

 

□統計的仮説検定

帰無仮説:薬の効果がない(主張したくない)

対立仮説:薬の効果はある(主張したい)

 

このように仮説を設定して、「帰無仮説が正しい」というもとで、検定を進めていきます。もし、検定統計量を観測データから算出した値が「滅多に」でない値である場合はどうすれば解釈すればよいでしょうか。これは「帰無仮説が正しいもとで、滅多に出ない値が算出された。」と理解できます。そして、「帰無仮説が正しい」と考えるのは間違いであり、帰無仮説を棄却し、対立仮説を採択します。この逆、つまり統計量があり得そうな値の場合、対立仮説を棄却して、帰無仮説を採択することになります。

 

次に問題になるのが、どれくらいの統計量ならば、「あり得そう」なのか、「あり得なさそう」なのかの基準を考えないといけません。そこで登場するのが「有意水準」です。有意水準αの値は10%、5%、1%、0.1%などが使われます。この基準をもとに統計量を評価して、仮説を扱います。この有意水準は帰無分布のもとで利用されます。帰無分布は帰無仮説のもとでの標本分布のことです。

 

帰無仮説のもとで、滅多におこらない統計量の範囲を「棄却域」と呼びます。つまり、棄却域に統計量が入った場合、帰無仮説を棄却することになります。反対に、対立仮説を採択する範囲のことを「採択域」と言います。境目は「臨界値」といいます。

 

さて、統計量が棄却域に入った場合、帰無仮説を棄却することはすでに説明しましたが、統計学的にはどう表現すればよいでしょうか。論文や報告書にまとめる場合のときとかですね。その時は「5%水準で有意である」とか「p<.05で有意である」と表現すれば問題ありません。ここで出てきたp値とはなんでしょうか。これは、帰無仮説が正しいもとで、標本から計算した統計量が実現する確率のことです。つまり、p値が有意水準αを下回る場合、帰無仮説を棄却します。p<αのときです。例えば,標準正規分布で 1.96 以上となる確率は 2.5%であり、有意確率がまえもって定めた有意水準より小さい場合に帰無仮説を棄却し,大きい場合に帰無仮説を採択する。では、Rで実践してみましょう。

 

□問題

ある大学の厳しい教授の20点満点の小テストでは、平均得点が10、分散5の正規分布に従うことがわかっています。このとき、今年度のテスト結果は、この母集団からの標本と考えることができるか。

 

①仮説の設定

帰無仮説:μ=10

対立仮説:μ≠10

 

②統計量の計算

Z= x−μ/σ/√n

 

有意水準

有意水準は5%

 

> test <- c(10,2,4,5,7,8,5,6,7,8,9,9,2,3,4,5,6,4,7,9)

> test

[1] 10 2 4 5 7 8 5 6 7 8 9 9 2 3 4 5 6 4 7 9

> length(test)

[1] 20

> mean(test)

[1] 6

> numer <- mean(test)-10 #numer=分子の意味

> numer

[1] -4

> denom <- sqrt(5/length(test)) #denom=分母の意味

> denom

[1] 0.5

> statistic.z <- numer/denom

> statistic.z

[1] -8

> qnorm (0.025) #下側確率0.025となるz値を求める

[1] -1.959964

> qnorm (0.975)

[1] 1.959964

> curve(dnorm(x),-4,4) #標準正規分布を書く

> abline(v=qnorm(0.025)) #下側確率2.5%のところに垂線を引く

> abline(v=qnorm(0.975))

f:id:teruaki-sugiura:20150808200544p:plain

> 2*pnorm(z値) #p値を計算できます。

 

以上より、z<1.96 and z>-1.96なので、帰無仮説を棄却し、対立仮説を採択します。今年度の小テストの結果は、これまでの母集団とは異なるといえます。

 

(補足)

p値とは、検定統計量を確率に変換したもの。例えば、標準正規分布のz値=2.9だったとする。有意水準α=5%(0.05)のとき、対応するz値は1.96となります。このとき、検定で判定する基準はz値を比較することになります。つまり、z=2.9>1.96であり、帰無仮説を棄却することになります。この関係を確率に置き換えると、z=2.9に対応する確率は、0.024であり、有意水準α=0.05と比較すると、0.024<0.05となり、z値に対応する確率値は小さい。

広告を非表示にする