読者です 読者をやめる 読者になる 読者になる

Rを通じて統計学を学ぶ備忘録ブログ

SPSSからRに移行したい私のような人向けのR解説ブログ兼学習用備忘録。

第12回 1変数の要約

第12回は1変数の要約について書きます。

 

調査データを手に入れた時、まず初めにすることはデータを図表化したり、平均などの基本的な統計量を算出する必要があります。第12回では1変数について、要約をしていきます。「demo」データセットは番号、名前、性別、数学、統計学、工学が好きかどうか、数学、統計学、工学のテスト結果、所属ゼミ、自習時間の量を20人分を記録しています。

demo <- read.csv("data2.csv",header=TRUE)
table(demo$sex) #度数分布表を返す

female male 
10        10 

table(demo$seminar) #度数分布表を返す

A B C D 
5  5 5  5

hist(demo$mathtest) #ヒストグラムを返す
png("histmath.png", width=640, height=480, type="quartz")

#拡張子png、640*480のサイズでファイル出力
hist(demo$mathtest)  #ヒストグラムを返す
dev.off() #デバイスを閉じる

f:id:teruaki-sugiura:20150712000903p:plain

sum(demo$mathtest) #合計値を返す
[1] 110
mean(demo$mathtest) #平均を返す
[1] 5.5
var(demo$mathtest) #分散を返す
[1] 7.526316
sd(demo$mathtest) #標準偏差を返す
[1] 2.743413
median(demo$mathtest) #中央値を返す
[1] 5.5
length(demo$mathtest) #データの個数を返す
[1] 20
max(demo$mathtest)
[1] 10
min(demo$mathtest)
[1] 1

smathtest <- scale(demo$mathtest) #数学テストを標準化
sstattest <- scale(demo$stattest) #統計テストを標準化
sengineeringtest <- scale(demo$engineeringtest) #工学テストを標準化
cbind(demo,smathtest,sstattest,sengineeringtest) 

#demoデータに標準化したものを追加する
write.csv(demo,"data20150711.csv") #標準化した変数をdemoに追加して書き出す
summary(demo$mathtest) #変数の要約
Min. 1st Qu. Median Mean 3rd Qu. Max. 
1.0 3.0  5.5   5.5   8.0  10.0 
boxplot(demo$mathtest) #箱ヒゲ図を返す

f:id:teruaki-sugiura:20150712023612p:plain

 1変数の要約について以上で終わりです。SPSSではマウスを2、3回押せば結果が見れたのと比べると時間がかかりますが、慣れればRは使いやすいですね。

関数おさらい
c():データを結合する
table():度数分布表を返す
hist():ヒストグラムを返す
boxplot():箱ヒゲ図を返す
sum():合計を返す
length():データの個数を返す
mean():平均を返す
median():中央値を返す
sqrt():平方根を返す
sd():標準偏差を返す
max():最大値を返す
min():最小値を返す
scale():標準化する
summary():変数を要約する

 第12回は以上でお終い。

広告を非表示にする