読者です 読者をやめる 読者になる 読者になる

Rを通じて統計学を学ぶ備忘録ブログ

SPSSからRに移行したい私のような人向けのR解説ブログ兼学習用備忘録。

R

第26回 分散分析(対応なし)

第26回は分散分析(対応なし)について書きます。 分散分析は3郡以上の母集団の平均値の検定のことです。 例えば、A,B,Cという3郡の母平均は等しいという帰無仮説を設定し、検定します。 ここでAとB,BとC,CとAに分けてt検定を行えば良いのでは??と考える…

第25回 t検定

第25回はt検定について書きます。 t検定は、2群の母集団の平均値が同じかどうかの検定です。t.test()関数を使用して、 デフォルトで引数 var.equal=FALSE が指定され、ウェルチのt検定(非等分散のt検定)が設定されています。var.equal=TRUE とすると等分…

第24回 カイ二乗検定とサンプルサイズのいけない関係

第24回 カイ二乗検定とサンプルサイズの関係について書きます。 > small<-matrix(c(3,8,5,4),2,2)> small > colnames(small) <- c("like","dislike") > rownames(small) <- c("math","stat") > small like dislikemath 3 5stat 8 4 > chisq.test(small,cor…

第23回 カイ二乗検定

第23回はカイ二乗検定について書きます。 カイ二乗検定は、質的変数間の関係を調べるもので、互いの変数が「独立」であるかどうかを調べます。独立とは、関係がないことを意味します。ノンパラメトリックな手法です。ノンパラメトリックとは、「母集団の分…

第22回 無相関検定

第22回は無相関検定についてか書きます。 この検定は、帰無仮説を「母集団において相関係数が=0」と設定し、仮説検定を行います。使用するデータは、第12回と同じ。cor.test関数を利用しする。カッコ内でmethod=以下を指定することで変更できる。 "pear…

第21回 確率分布(F分布)

第21回は確率分布(F分布)について書きます。 F分布とは、カイ二乗分布に従う2つの変数の比 U1 と U2 はカイ二乗分布(自由度がそれぞれd1 、d2 )に従い、U1 と U2 は統計学的に独立で、F分布に従う。(Fom Wikipedia) 分布 確率密度関数 乱数発生関数 …

第20回 確率分布(t分布)

第20回は確率分布(t分布)について書きます。 t分布は連続確率分布の一つであり、正規分布する母集団の平均と分散が未知で標本サイズが小さい場合に平均を推定する問題に利用される。また、 2つの平均値の差の統計的有意性を検討するt検定で利用される。t…

第19回 確率分布(カイ二乗分布)

第19回 確率分布(カイ二乗分布)について書きます。 独立に標準正規分布に従う k 個の確率変数 X1, ..., Xk をとる。 このとき、統計量 の従う分布のことを自由度 k のカイ二乗分布と呼ぶ。(From Wikipedia) 分布 確率密度関数 乱数発生関数 カイ自乗分…

第18回 確率分布(正規分布)

第18回は確率分布(正規分布)について書きます。 正規分布またはガウス分布は、平均値の付近に集積するようなデータの分布を表した連続的な変数に関する確率分布である。(From Wikipedia) 分布 確率密度関数 乱数発生関数 正規分布 dnorm(x,0,1) rnorm(…

第17回 確率分布(ポアソン分布)

第17回は確率分布(ポアソン分布)について書きます。 ポアソン分布 とは、所与の時間間隔で発生する離散的な事象を数える特定の確率変数 X を持つ離散確率分布のこと。(From wikipedia)。 確率密度関数 乱数発生関数 ポアソン分布 dpois(x,λ) rpois(n,λ…

第16回 確率分布(二項分布)

第16回は確率分布(二項分布)について書きます。 二項分布は、結果が成功か失敗のいずれかである n 回の独立な試行を行ったときの成功数で表される離散確率分布である。各試行における成功確率 p は一定であり、このような試行を、ベルヌーイ試行と呼ぶ。…

第15回 確率分布(一様分布)

第15回は確率分布(一様分布)について書きます。 一様分布は、離散型あるいは連続型の確率分布である。 サイコロを振ったときの、それぞれの目の出る確率など、すべての事象の起こる確率が等しい現象のモデルである(From wikipedia)。 分布 確率密度関数 …

第14回 推測統計学(標準誤差、中心極限定理)

第14回は推測統計学について書きます。 本来はSPSSで行っていた分析をRで再現するためのコードを書くという趣旨のはずだったのですが、Rを使っていると本当にいろんなことができるので、忘れないうちにいろいろ書いておきます。SPSSでは中心極限定理のシュ…

第12回補足 1変数の要約

第12回補足は1変数の要約について書きます。 ヒストグラムと確率密度の視覚化を行っていきます。 > par(mfrow=c(1,2)) #画面を1行2列に分割する> hist(demo$mathtest) #縦軸を「頻度」でヒストグラムを返す> hist(demo$mathtest,freq=FALSE) #縦軸を…

第13回 2変数の要約

第13回は2変数の要約について書きます。 まずは量的な変数間の関係を見るために、散布図を書きます。データセットは前回と同じです。

第12回 1変数の要約

第12回は1変数の要約について書きます。 調査データを手に入れた時、まず初めにすることはデータを図表化したり、平均などの基本的な統計量を算出する必要があります。第12回では1変数について、要約をしていきます。 「demo」データセットは番号、名…

第11回 パッケージのインストール

第11回はパッケージのインストールについて書きます。 そもそもRはパッケージをインストールすることを前提に設計されています。 SPSSでは、バージョンによって分析手法が制限されています。そのため、新しい分析手法を使って分析をしようと思っても、最新…

第10回 データの書き出し

第10回はデータセットの書き出しについて書きます。 write.csv関数、write.table関数、write関数、sink関数などがあります。 ここでは、write.csv関数で「studentdata」を「studentdata20150710」として出力してみる。 > write.csv(studentdata,"studentda…

第9回 データの読み込み

第9回はデータの読み込みについて書きます。 SPSSでは、savファイルかexcelファイルを簡単に読み込み、データを表示することができましたが、Rでは少し手間がかかります。 データをカンマ(,)で区切り、拡張子がcsv形式で保存されたcsvファイルが一般的に…

第8回 Rのデータオブジェクトと操作

第8回はRのデータオブジェクトについて書きます。 データオブジェクトとは何か。簡単いうと、処理対象のデータセットのことです。Rでは実数、文字、論理値などのデータを、ベクトル、行列、データフレーム、リストなどの形式で扱います。 例えば、xに100を…

第6回 行列の演算

第6回は行列の演算について書きます。 行列を使って、基本演算を行っていきましょう。 2×3の行列を例に計算していきましょう。 > matrix1 <- matrix(1:6,2,3) > matrix1 [,1] [,2] [,3] [1,] 1 3 5 [2,] 2 4 6 > matrix2 <- matrix(6:11,2,3) > matrix2 [,1…

第5回 行列の作成

第5回は行列(matrix)の計算について書きます。 簡単にいうと、行列は縦横にデータの値を並べたもの。 統計解析では、横に変数(n個)、縦に人(p個)を配置したデータセット(n×p個)が利用しますが、これも行列として見れます。 matrix関数を使って行列…

第4回 ベクトルと行列の計算

第4回はベクトルと行列(マトリックス)の計算について書きます。 ベクトルの話になると出てくるのが「スカラー」。 「ベクトル」との違いは何でしょう。 スカラー:単一の値を持つもの(=大きさのみを持つ量) ベクトル:縦もしくは横に複数の値を並べた…

第3回 基本的な演算

R

第3回は、基本的な演算について書きます。 まずRの「>」のことを「プロンプト」といいます。 早速、計算してみましょう。 > 1+2 #足し算[1] 3> 2-1 #引き算[1] 1> 1-2 #引き算[1] -1> 2*4 #掛け算[1] 8> 2/4 #割り算[1] 0.5> sqrt(25) #25の正の平方…

第2回 Rの作業ディレクトリとは

R

第2回は「作業ディレクトリ」について書きます。 Rを使う前には、「作業ディレクトリ」を設定しましょう。 「作業ディレクトリ」とは、ファイルからデータセットを読み込んだり、出力結果を書き出す場所のことです。Rの起動時は、ホームディレクトが作業デ…

第1回 どうしてRを使うのか

R

2016/8/31 このブログは以下のサイトに移動しました。 こちらをご覧ください。修正・加筆をしております。 http://rtokei.tech/other/20150711000052/ このハテナブログでは、統計学とRに関する知識をまとめていく予定です。きっかけは、SPSSからRに移行して…

第1回 どうしてRを使うのか

このWEBページでは、統計学とRに関する知識をまとめていく予定です。Aboutにも書かさせていただいたのですが、このサイトはRを通じて統計学を学びながら、Rも学ぶことを目的にしています。基本的な統計学の事柄からMCMC階層ベイズなどの応用までをカバーして…