Rを通じて統計学を学ぶ備忘録ブログ

SPSSからRに移行したい私のような人向けのR解説ブログ兼学習用備忘録。

第32回 区間推定

第32回は区間推定について書きます。

前回は回帰分析の信頼区間や予測区間について書きましたが、統計的推定について書いていなかったので、順番逆ですが「そもそも」区間推定とは何か、これが今回のお話です。

 

標本→母集団のパラメタを推定する方法は2つあります。

⑴点推定(Point estimate)

母数をただ一つの値で推測する方法で、推定量の評価基準は以下。

・普遍性

標本サイズに関係なく、「ある母数θ」と「推定量のθ」が一致すること。言い換えると、何度も同じ方法で標本抽出し、何度も同じ方法で推定量を求めた平均が、母数θと一致します。普遍性を満たす推定量は「普遍」推定量といいます。

・一致性

標本サイズが十分大きい時に、推定量が母数θと一致する。言い換えると、標本調査から全数調査に近づくにつれ、推定量が母数に近づく。

 

⑵区間推定(Interval estimate)

母数をある確からしさのもとで区間を持って推測する方法。母数θが分析者が定めた区間[α≦θ≦β]に入る確率P(α≦θ≦β)=1-α以上になるような区間を標本をデータから推定する。区間αβを母数θの「100*(1-α)%信頼区間」という。区間が母を含む確率(1-α)を「信頼度」といい、0.99、0.95、0.90が一般的に使われます。

さぁ、Rで実践しましょう。データはR備え付けのデータ「Orange」です。circumference(円周)の信頼区間はt.test関数を使って求めます。

 

> head(Orange)

 Tree  age  circumference
1  1  118  30
2  1  484  58
3     1    664     87

> mean(Orange$circumference)
[1] 115.8571

 

>t.test(Orange$circumference,alternative="two.sided",mu=115.8571,conf.level=.90) #90%信頼区間

One Sample t-test

data: Orange$circumference
t = 4.4104e-06, df = 34, p-value = 1
alternative hypothesis: true mean is not equal to 115.8571
90 percent confidence interval:
99.42597 132.28832
sample estimates:
mean of x
115.8571

>t.test(Orange$circumference,alternative="two.sided",mu=115.8571,conf.level=.99) #99%信頼区間

One Sample t-test

data: Orange$circumference
t = 4.4104e-06, df = 34, p-value = 1
alternative hypothesis: true mean is not equal to 115.8571
99 percent confidence interval:
89.34458 142.36970
sample estimates:
mean of x
115.8571

 

90%、99%で信頼区間を求めてみました。

90%信頼区間は99.4〜132.2。

99%信頼区間は89.3〜142.3。

 

以上で、第32回はお終い。