Rを通じて統計学を学ぶ備忘録ブログ

SPSSからRに移行したい私のような人向けのR解説ブログ兼学習用備忘録。

その他(R関係)

ちょっとした備忘録のページ。

x set.seed(71) dat dat a b c 1 3 1 6 2 5 7 2 3 3 1 7 4 2 7 2 5 3 8 1 6 9 7 4 7 6 1 4 8 8 8 3 9 3 8 2 10 4 9 8 #a列で重複している行を削除 dat[!duplicated(dat$a), ] a b c 1 3 1 6 2 5 7 2 4 2 7 2 6 9 7 4 7 6 1 4 8 8 8 3 10 4 9 8 #b,c列の組み…

大学の時の備忘録〜社会心理学〜

以下は備忘録です。大学院の時に社会心理学を学んでおり、そのときの講義、参考書、文献のメモです。そのため、申し訳ありませんが、引用元の明記および引用範囲が明確ではありません。間違っている場合も多いにありえます。参考にされた方はご了承ください…

大学の時の備忘録〜社会学〜

以下は備忘録です。大学院の時に社会心理学を学んでおり、そのときの講義、参考書、文献のメモです。そのため、申し訳ありませんが、引用元の明記および引用範囲が明確ではありません。間違っている場合も多いにありえます。参考にされた方はご了承ください…

番外編〜行列の「行」って、「横」なの?「縦」なの?どっちなの?〜

今回は番外編です。番外編を書くきっかけは、Twitterを見てたらRowとColumnの方向を覚えたけど、すぐ忘れてどっちがどっちかわからない、というつぶやきを発見したので、まさに過去の自分のようで、、、、、そのような人たちのお力になれたらと思い急遽、番…

第77回 当たりが出やすい宝くじ売り場!?

第77回は、たまにはブログも息抜きも必要ということで「当たりが出やすい宝くじ売り場!?」は存在するのか否かについて考えてみます。おそらく皆様の近所にも存在する「当たりが出やすい」と謳っている宝くじ売り場のことです。さてはて、本当なのでしょ…

第73回 データの整形に関する備忘録

個人的には重要なのにすぐ忘れるので、データの整形に関する備忘録。 □データフレームの操作 □因子の順序を変更 sizes □データの大小に応じて因子の順序を変更 IS$spray □ファクタのレベル名を変更 sizes1 □カテゴリカル変数を別のカテゴリカル変数に変更 ol…

第71回 apply familyとdplyrパッケージの備忘録

今回はapply familyについて見ていきます。apply familyとは大量のデータを効率よく処理してくれる関数群のことです。for文を書かなくてもapply familyで解決できることもあります。apply familyには、apply(),tapply(),lapply(), sapply(),mapply()がありま…

第64回 畳み込み(合成積) ~Convolution~

久しぶりの更新です。ベイズもやっていく予定ですが、年末はRのグラフィック関係についてまとめていくことにします。そうといいながらも今回は例外的に「畳み込み」についてみていきます。畳み込みは確率分布の導出過程を勉強しているとでてきます。カイ二乗…

第62回 Time Seriesデータへの成型

Time Seriesデータへの成型 参考にするのは以下の書籍です。 www.shoeisha.co.jp さて、今回扱うデータ、コードは「楽しいR」のものを利用させてもらいます。目標は、曜日変数とtime lag変数の追加です。 □Time lagとは データをシフトして比較するときや、…

第60回 曜日の追加

第60回はデータセットへ曜日の追加について書いていきます。まさに本日の内容は備忘録。元データをエクセルで加工すれば、こんなことはしなくても良いのですが・・・・Rで実践。 sample <- read.csv("demo.csv",header=TRUE) sample day1 <- weekdays(as.D…

第55回 検定力分析

第55回は検定力分析について書いていきます。検定では、サンプルサイズ、有意水準、効果量、検定力を適切に検討しなければいけません。なぜなら、サンプルサイズが大きいと、有意な差が生まれやすくなってしまいますし、サンプルサイズが小さい、本当は差…

第54回 オイラーの等式&せん妄

第54回 オイラーの等式について書きます。 本日は、さんざんな1日でした。午前中はオイラーの等式(大部分はオイラー角)について話を先輩としていた反面、夕方からは突如簡単な計算や短期的に物事が記憶できなくなったり(頭がふわっとしていた)と、なん…

第53回 フィッシャー情報量

第53回はFisher情報量について書いていきます。辞書で調べてみると、「確率変数Xが母数θに対して持っている『情報』の量を表す」と書かれています。うーん・・・・わかるようでわからない。情報を持っているからどうなの?という疑問が生まれました(個人…

二項検定と大阪ダービー(ガンバ大阪 vs. セレッソ大阪)

今回は二項検定を使って、サッカーJ1リーグ、ガンバ大阪とセレッソ大阪のどちらが強いのかを検定してみたいと思います。 二項検定とは、試合に勝つ・負けるというような2値しかとらない変数を対象とする検定法です。これまで、ガンバ大阪とセレッソ大阪の通…

第41回 AIC

第41回はAICについて書きます。 以前の記事でもモデル選択の記事でAICはちらっと紹介しましたが、今回はAICに焦点をあてて書いていきます。数式はほとんど使いません。 □AICの考え方 モデル選択では、問題意識として、どのような統計モデルを選択するべき…

第40回 パラメタ推定法(最尤法) 

第40回はパラメタ推定法(最尤法)について書きます。 パラメタの推定法はいくつかありますが、回帰分析では特に指定がない限り、「最小二乗法」を使ってパラメタを推定します。しかし、回帰分析の種類によっては、最小二乗法でパラメタを求めることが好ま…

第29回 検定の多重性

第29回は検定の多重性について書きます。 以下の書籍のコードを参考に見ていきましょう

第11回 パッケージのインストール

第11回はパッケージのインストールについて書きます。 そもそもRはパッケージをインストールすることを前提に設計されています。 SPSSでは、バージョンによって分析手法が制限されています。そのため、新しい分析手法を使って分析をしようと思っても、最新…

第10回 データの書き出し

第10回はデータセットの書き出しについて書きます。 write.csv関数、write.table関数、write関数、sink関数などがあります。 ここでは、write.csv関数で「studentdata」を「studentdata20150710」として出力してみる。 write.csv(studentdata,"studentdata…

第9回 データの読み込み

第9回はデータの読み込みについて書きます。 SPSSでは、savファイルかexcelファイルを簡単に読み込み、データを表示することができましたが、Rでは少し手間がかかります。 データをカンマ(,)で区切り、拡張子がcsv形式で保存されたcsvファイルが一般的に…

第8回 Rのデータオブジェクトと操作

第8回はRのデータオブジェクトについて書きます。 データオブジェクトとは何か。簡単いうと、処理対象のデータセットのことです。Rでは実数、文字、論理値などのデータを、ベクトル、行列、データフレーム、リストなどの形式で扱います。 例えば、xに100を…

第7回 その他の行列(対角、単位行列)と要素の取り出し

第7回は行列の要素の取扱について書きます。まず、正方行列とは、行要素と列要素の数が同じ行列です。n行×n列の時、n次正方行列です。 > matrix matrix [,1] [,2] [,3] [1,] 1 4 7 [2,] 2 5 8 [3,] 3 6 9 > ##対角要素を1~5にして作成 > diag(c(1,2,3,4,5)) …

第6回 行列の演算

第6回は行列の演算について書きます。 行列を使って、基本演算を行っていきましょう。 2×3の行列を例に計算していきましょう。 > matrix1 matrix2 matrix1 + matrix2 [,1] [,2] [,3] [1,] 7 11 15 [2,] 9 13 17 > matrix1 - matrix2 [,1] [,2] [,3] [1,] -5…

第5回 行列の作成

第5回は行列(matrix)の計算について書きます。 簡単にいうと、行列は縦横にデータの値を並べたものです。統計解析では、横に変数(n個)、縦に人(p個)を配置したデータセット(n×p個)が利用しますが、これも行列として見れます。さっそく動かしてみま…

第4回 ベクトルと行列の計算

第4回はベクトルと行列(マトリックス)の計算について書きます。ベクトルの話になると出てくるのが「スカラー」というものですね。一体、「スカラー」と「ベクトル」との違いは何でしょう。大まかに言うと、スカラーは単一の値を持つもの(=大きさのみを…

第3回 Rでの基本的な演算

第3回は、基本的な演算について書きます。まずRの画面に出てくる「<-」は「プロンプト」と呼びます。このプロンプトに沿って演算や関数を使って分析をしていくことになります。早速、足し算からニュートン法まで計算してみましょう。 ※f(x)=x3-5の図。x=0は…

第2回 Rの作業ディレクトリとは

第2回は「作業ディレクトリ」について書いていきます。まず、Rで分析を始める前に「作業ディレクトリ」を設定しましょう。作業ディレクトリとは、分析の起点となるフォルダのことで、データセットの読み込みや図表の書き出しにおける参照元のことです。つま…

第1回 どうしてRを使うのか

このWEBページでは、統計学とRに関する知識をまとめていく予定です。Aboutにも書かさせていただいたのですが、このサイトはRを通じて統計学を学びながら、Rも学ぶことを目的にしています。基本的な統計学の事柄からMCMC階層ベイズなどの応用までをカバーして…