Rを通じて統計学を学ぶ備忘録ブログ

SPSSからRに移行したい私のような人向けのR解説ブログ兼学習用備忘録。

第13回 2変数の要約

 

第13回は2変数の要約について書きます。

 

まずは量的な変数間の関係を見るために、散布図を書きます。データセットは前回と同じです。

 

sugisugirrr.hatenablog.com

 

 

> plot(demo$mathtest,demo$stattest)

f:id:teruaki-sugiura:20150712013716p:plain

 > cov(demo$stattest,demo$mathtest) #共分散を返す

[1] -2.421053

> cor(demo$stattest,demo$mathtest) #相関係数を返す
[1] -0.3583963

 

plot関数についてもう少し詳しく。

plot関数おさらい

plot(x,y,xlim=range(x),ylim=range(y),type="○",main, xlab="○",ylab="○")

x:横軸の変数

y:縦軸の変数

xlim:横軸の範囲

ylim:横軸の範囲

type

p:○を描く

I:点を通過する線のみ

b:線と点を連結

c:点を飛ばして線をひく

h:y方向に垂直線

n:枠のみ

main:タイトルをつける

xlab:横軸に名前をつける

ylab:縦軸に名前をつける

 

 

統計分析では、データをまず図表にすることはとても大事です。数字だけを見ていても、関係は分かりにくいですが、図にすることで視覚的に情報を得やすくなります。

次は、質的な変数間の関係を見るために、クロス集計表を書きます。質的な変数間の関係を見るためには、名義尺度を2値変数に変換して、φ係数を求めます。二値変数に変換する際は=ではなく、==にする必要があります。

=は代入を意味し、==は左右が対等であることを示します。

> table(demo$stat,demo$math)

   dislike like
dislike  3   8
like    5        4

> mathbinary <- ifelse(demo$math=="like",1,0) #二値変数に変換
> statbinary <- ifelse(demo$stat=="like",1,0) #二値変数に変換

> engineeringbinary <- ifelse(demo$engineering=="like",1,0) #二値変数に変換
> demo <- cbind(demo,mathbinary,statbinary,engineeringbinary) #バイナリー変数を追加
> write.csv(demo,"data20150712.csv") #データを書き出し

> cor(demo$mathbinary,demo$statbinary) #ファイ係数を算出
[1] -0.2872135

次回からは、記述統計学ではなく、母集団を想定した推測統計学の話に移ります。

関数おさらい

plot():散布図を返す

cov():共分散を返す

cor():相関係数(φ係数)を返す

table():クロス集計表を返す

ifelse(): 場合分けを返す

 以上で第13回はお終い。

広告を非表示にする