読者です 読者をやめる 読者になる 読者になる

Rを通じて統計学を学ぶ備忘録ブログ

SPSSからRに移行したい私のような人向けのR解説ブログ兼学習用備忘録。

第78回 ブートストラップ法

今回はブートストラップ法について見ていきましょう。ブートストラップ法はモンテカルロ法の一種で、標本から標本を再抽出することで、母集団の性質を推測する方法のことです。観測されたサンプルデータから母集団の性質を推測するとき、必ず誤差が生じてい…

第53回 フィッシャー情報量

第53回はFisher情報量について書いていきます。辞書で調べてみると、「確率変数Xが母数θに対して持っている『情報』の量を表す」と書かれています。うーん・・・・わかるようでわからない。情報を持っているからどうなの?という疑問が生まれました(個人…

第40回 パラメタ推定法(最尤法) 

第40回はパラメタ推定法(最尤法)について書きます。 パラメタの推定法はいくつかありますが、回帰分析では特に指定がない限り、「最小二乗法」を使ってパラメタを推定します。しかし、回帰分析の種類によっては、最小二乗法でパラメタを求めることが好ま…

第32回 区間推定

第32回は区間推定について書きます。 前回は回帰分析の信頼区間や予測区間について書きましたが、統計的推定について書いていなかったので、順番逆ですが「そもそも」区間推定とは何か、これが今回のお話です。 標本→母集団のパラメタを推定する方法は2つ…

第31回 回帰分析の信頼区間・予測区間

第31回は回帰分析の信頼区間・予測区間について書きます。 前回は、母平均の信頼区間についてかきましたが、回帰分析では、母回帰の推定を行うことになります。信頼区間の解釈は前回記事と同じです。予測区間とは、xの値は信頼率○%でいくつ以上、いくつ以…

第30回 信頼区間

はやいもので第30回に突入。とはいっても、忘れた時に見返すために学生の頃にメモに書いていた授業・自習の内容をはてなブログに載せているからですが・・・ そんな個人的なことはさておき、本日は信頼区間について書きます。 信頼区間は案外、解釈が難し…

第13回の補足 2変量以上の相関係数 

第13回の補足では2変量の相関係数について書きます。 相関係数が2変数(データセットでは2列)の場合、cor(x,y)と簡単に相関係数を求めることができましたが、変数が10列、20列と多い場合はどうすればよいでしょうか。1つ1つ、組み合わせて係数を求めて…

第29回 検定の多重性

第29回は検定の多重性について書きます。 以下の書籍のコードを参考に見ていきましょう

第28回 二元配置分散分析(対応なし)

第28回は二元配置分散分析(対応なし)について書きます。 2つの条件の組み合わせによって母平均が異なるかどうかを検定します。例えば、教室A、Bがあり、教室Aの中でも生徒数を10人クラス、20人クラス、30人クラスと分け、教室Bでも同様に振り分ける。教…

第27回 分散分析(対応あり)

第27回は分散分析(対応あり)について書きます。 対応のある分散分析としていきましょう。 対応のある分散分析は例えば、食品a、b、cの美味しさを測定するときに、食品aを1〜5の人に食べてもらい、食品b、食品cも同様に1〜5の人に食べてもらいます。つま…

第26回 分散分析(対応なし)

第26回は分散分析(対応なし)について書きます。 分散分析は3郡以上の母集団の平均値の検定のことです。 例えば、A,B,Cという3郡の母平均は等しいという帰無仮説を設定し、検定します。 ここでAとB,BとC,CとAに分けてt検定を行えば良いのでは??と考える…

第25回 t検定

第25回はt検定について書きます。 t検定は、2群の母集団の平均値が同じかどうかの検定です。t.test()関数を使用して、 デフォルトで引数 var.equal=FALSE が指定され、ウェルチのt検定(非等分散のt検定)が設定されています。var.equal=TRUE とすると等分…

第24回 カイ二乗検定とサンプルサイズのいけない関係

第24回 カイ二乗検定とサンプルサイズの関係について書きます。 > small<-matrix(c(3,8,5,4),2,2)> small > colnames(small) <- c("like","dislike") > rownames(small) <- c("math","stat") > small like dislikemath 3 5stat 8 4 > chisq.test(small,cor…

第23回 カイ二乗検定

第23回はカイ二乗検定について書きます。 カイ二乗検定は、質的変数間の関係を調べるもので、互いの変数が「独立」であるかどうかを調べます。独立とは、関係がないことを意味します。ノンパラメトリックな手法です。ノンパラメトリックとは、「母集団の分…

第22回 無相関検定

第22回は無相関検定についてか書きます。 この検定は、帰無仮説を「母集団において相関係数が=0」と設定し、仮説検定を行います。使用するデータは、第12回と同じ。cor.test関数を利用しする。カッコ内でmethod=以下を指定することで変更できる。 "pear…

第14回 推測統計学(標準誤差、中心極限定理)

第14回は推測統計学について書きます。 本来はSPSSで行っていた分析をRで再現するためのコードを書くという趣旨のはずだったのですが、Rを使っていると本当にいろんなことができるので、忘れないうちにいろいろ書いておきます。SPSSでは中心極限定理のシュ…