読者です 読者をやめる 読者になる 読者になる

Rを通じて統計学を学ぶ備忘録ブログ

SPSSからRに移行したい私のような人向けのR解説ブログ兼学習用備忘録。

第13回 2変数の要約

多変量解析

 第13回は2変数の要約について書きます。

 

まずは量的な変数間の関係を見るために、散布図を書きます。データセットは前回と同じです。

sugisugirrr.hatenablog.com

plot(demo$mathtest,demo$stattest)

f:id:teruaki-sugiura:20150712013716p:plain

cov(demo$stattest,demo$mathtest) #共分散を返す
[1] -2.421053
cor(demo$stattest,demo$mathtest) #相関係数を返す
[1] -0.3583963

plot関数についてもう少し詳しく。

plot関数おさらい

plot(x,y,xlim=range(x),ylim=range(y),type="○",main, xlab="○",ylab="○") x:横軸の変数 y:縦軸の変数 xlim:横軸の範囲 ylim:横軸の範囲 type p:○を描く I:点を通過する線のみ b:線と点を連結 c:点を飛ばして線をひく h:y方向に垂直線 n:枠のみ main:タイトルをつける xlab:横軸に名前をつける ylab:縦軸に名前をつける

統計分析では、データをまず図表にすることはとても大事です。数字だけを見ていても、関係は分かりにくいですが、図にすることで視覚的に情報を得やすくなります。

次は、質的な変数間の関係を見るために、クロス集計表を書きます。質的な変数間の関係を見るためには、名義尺度を2値変数に変換して、φ係数を求めます。二値変数に変換する際は=ではなく、==にする必要があります。

=は代入を意味し、==は左右が対等であることを示します。

table(demo$stat, demo$math)

       dislike like
dislike  3       8
like    5        4

mathbinary <- ifelse(demo$math=="like",1,0) #二値変数に変換
statbinary <- ifelse(demo$stat=="like",1,0) #二値変数に変換

engineeringbinary <- ifelse(demo$engineering=="like",1,0) #二値変数に変換
demo <- cbind(demo,mathbinary,statbinary,engineeringbinary) #バイナリー変数を追加
write.csv(demo,"data20150712.csv") #データを書き出し

cor(demo$mathbinary,demo$statbinary) #ファイ係数を算出
[1] -0.2872135

次回からは、記述統計学ではなく、母集団を想定した推測統計学の話に移ります。

関数おさらい

plot():散布図を返す

cov():共分散を返す

cor():相関係数(φ係数)を返す

table():クロス集計表を返す

ifelse(): 場合分けを返す

 以上で第13回はお終い。

広告を非表示にする