Rを通じて統計学を学ぶ備忘録ブログ

SPSSからRに移行したい私のような人向けのR解説ブログ兼学習用備忘録。

第12回 1変数の要約

第12回は1変数の要約について書きます。

 

調査データを手に入れた時、まず初めにすることはデータを図表化したり、平均などの基本的な統計量を算出する必要があります。第12回では1変数について、要約をしていきます。

「demo」データセットは番号、名前、性別、数学、統計学、工学が好きかどうか、数学、統計学、工学のテスト結果、所属ゼミ、自習時間の量を20人分を記録しています。

 

> demo <- read.csv("data2.csv",header=TRUE)

>table(demo$sex) #度数分布表を返す

female male 

10        10
> table(demo$seminar) #度数分布表を返す

A B C D
5  5 5  5

>hist(demo$mathtest) #ヒストグラムを返す

> png("histmath.png", width=640, height=480, type="quartz")

拡張子png、640*480のサイズでファイル出力
> hist(demo$mathtest)  #ヒストグラムを返す

>dev.off() #デバイスを閉じる


f:id:teruaki-sugiura:20150712000903p:plain

> sum(demo$mathtest) #合計値を返す
[1] 110
> mean(demo$mathtest) #平均を返す
[1] 5.5
> var(demo$mathtest) #分散を返す
[1] 7.526316

> sd(demo$mathtest) #標準偏差を返す
[1] 2.743413
> median(demo$mathtest) #中央値を返す
[1] 5.5
> length(demo$mathtest) #データの個数を返す
[1] 20
> max(demo$mathtest)
[1] 10
> min(demo$mathtest)
[1] 1

> smathtest <- scale(demo$mathtest) #数学テストを標準化

> sstattest <- scale(demo$stattest) #統計テストを標準化

> sengineeringtest <- scale(demo$engineeringtest) #工学テストを標準化
> cbind(demo,smathtest,sstattest,sengineeringtest) 

#demoデータに標準化したものを追加する

> write.csv(demo,"data20150711.csv") #標準化した変数をdemoに追加して書き出す

 

> summary(demo$mathtest) #変数の要約
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.0 3.0  5.5   5.5   8.0  10.0
> boxplot(demo$mathtest) #箱ヒゲ図を返す

f:id:teruaki-sugiura:20150712023612p:plain

 1変数の要約について以上で終わりです。SPSSではマウスを2、3回押せば結果が見れたのと比べると時間がかかりますが、慣れればRは使いやすいですね。

関数おさらい

c():データを結合する

table():度数分布表を返す

hist():ヒストグラムを返す

boxplot():箱ヒゲ図を返す

sum():合計を返す

length():データの個数を返す

mean():平均を返す
median():中央値を返す
sqrt():平方根を返す
sd():標準偏差を返す
max():最大値を返す
min():最小値を返す
scale():標準化する
summary():変数を要約する

 第12回は以上でお終い。

広告を非表示にする