Rを通じて統計学を学ぶ備忘録ブログ

SPSSからRに移行したい私のような人向けのR解説ブログ兼学習用備忘録。

第76回 重回帰分析と交互作用〜説明変数が2つ以上の時の作図〜

久しぶりの更新です。このブログのアクセス解析ページを見てみると、重回帰分析と交互作用のページへのアクセスが多いようなので、それに関連するトピックで記事を書いていきます。過去の関連記事は以下から参照ください。 第31回 回帰分析と重回帰分析 - …

第75回 ポリコリック相関係数・ポリシリアル相関係数

ポリコリック相関係数のp_11~p_00のp_00の式に誤りがありましたので、修正しました。(2016年2月21日) ポリコリック相関係数・ポリシリアル相関係数 カテゴリ変数の関係をみようとすると、これまではスピアマンの順位相関係数とかケンドールの順位相関係数…

第75回 ポリコリック相関係数・ポリシリアル相関係数

R

ポリコリック相関係数のp_11~p_00のp_00の式に誤りがありましたので、修正しました。(2016年2月21日) ポリコリック相関係数・ポリシリアル相関係数 カテゴリ変数の関係をみようとすると、これまではスピアマンの順位相関係数とかケンドールの順位相関係数…

ベイズ統計学その15〜線形回帰モデルとMCMC〜

今回はMCMCを使った線形回帰モデルをRで実践しながら見ていきます。その過程ででくわす基本的な用語も攫っていきます。 ベイズの線形回帰モデルを考える際には、未知パラメタβと誤差項のσ^2を求めることが目標になります。その際に、尤度関数をどう考えるか…

第74回 ポアソン分布とサッカーのゴール数

今回は、ポアソン分布とサッカーのゴール数の関係をもとに、基本的なポアソン分布の説明から、オフセットと過分散も検討したポアソン回帰までみていきます。 ポアソン分布 サッカーのゴール数がポアソン分布に従うことは有名な話ですね。そもそもポアソン分…

第74回 ポアソン分布とサッカーのゴール数

今回は、ポアソン分布とサッカーのゴール数の関係をもとに、基本的なポアソン分布の説明から、オフセットと過分散も検討したポアソン回帰までみていきます。 ポアソン分布 サッカーのゴール数がポアソン分布に従うことは有名な話ですね。そもそもポアソン分…

第73回 データの整形に関する備忘録

個人的には重要なのにすぐ忘れるので、データの整形に関する備忘録。 □データフレームの操作 □因子の順序を変更 sizes □データの大小に応じて因子の順序を変更 IS$spray □ファクタのレベル名を変更 sizes1 □カテゴリカル変数を別のカテゴリカル変数に変更 ol…

第73回 データの整形に関する備忘録

個人的には重要なのにすぐ忘れるので、データの整形に関する備忘録。 □データフレームの操作 □因子の順序を変更 > sizes <- factor(c("small", "large", "large", "small", "medium”)) > sizes.sml <- factor(sizes, levels = c("small", "medium", "large”)…

第72回 ggplot備忘録その8

今回はヒストグラムに関するggplotのコードを見ていきます。 基本的な設定ではビンの数が30になっているので、binwidthで調整することも忘れずに。また、同じデータでも、調整次第では全く違うように見させることも可能ですが、そうならないように注意する必…

第72回 ggplot備忘録その8

今回はヒストグラムに関するggplotのコードを見ていきます。 基本的な設定ではビンの数が30になっているので、binwidthで調整することも忘れずに。また、同じデータでも、調整次第では全く違うように見させることも可能ですが、そうならないように注意する必…

第71回 apply familyとdplyrパッケージの備忘録

今回はapply familyについて見ていきます。apply familyとは大量のデータを効率よく処理してくれる関数群のことです。for文を書かなくてもapply familyで解決できることもあります。apply familyには、apply(),tapply(),lapply(), sapply(),mapply()がありま…

第71回 apply familyとdplyrパッケージの備忘録

今回はapply familyについて見ていきます。apply familyとは大量のデータを効率よく処理してくれる関数群のことです。for文を書かなくてもapply familyで解決できることもあります。apply familyには、apply(),tapply(),lapply(), sapply(),mapply()がありま…

第70回 ggplotの備忘録その7

今回は散布図に回帰直線と信頼区間を書き込み場合のggplotのコードを見ていきます。単回帰分析であってもRのベースグラフィックから散布図に信頼区間を書き込むのは苦労しますが、ggplotでは非常に簡単です。ggplotが自動的に計算してくれます。 ggplot(demo…

第70回 ggplotの備忘録その7

今回は散布図に回帰直線と信頼区間を書き込み場合のggplotのコードを見ていきます。 単回帰分析であってもRのベースグラフィックから散布図に信頼区間を書き込むのは苦労しますが、ggplotでは非常に簡単です。ggplotが自動的に計算してくれます。 > ggplot(d…

第68回 ggplotの備忘録その5

今回は折れ線グラフを中心に見ていきます。注意することは、x軸には連続変数をもってくることが多いですが、離散変数を使う場合はファクタ化する必要があることかなー。 ggplot(demo, aes(x = no, y = y, col = class)) + geom_line(linetype = "dashed") + …

第68回 ggplotの備忘録その5

今回は折れ線グラフを中心に見ていきます。注意することは、x軸には連続変数をもってくることが多いですが、離散変数を使う場合はファクタ化する必要があることかなー。 ggplot(demo, aes(x = no, y = y, col = class)) + geom_line(linetype = "dashed") + …

第67回 ggplotの備忘録その4

今回はggplot2の棒グラフを中心にみていきます。棒グラフを作成する際に注意すべき点は、y軸に「個数」を配置するのか、「値」を配置するのかを区別することくらいかなー。 ggplot(demo, aes(x = order, y = y))+geom_bar(stat = "identity") #stat="identi…

第67回 ggplotの備忘録その4

今回はggplot2の棒グラフを中心にみていきます。棒グラフを作成する際に注意すべき点は、y軸に「個数」を配置するのか、「値」を配置するのかを区別することくらいかなー。 > ggplot(demo, aes(x = order, y = y))+geom_bar(stat = "identity") #stat="iden…

第69回 ggplotの備忘録その6

今回は散布図を中心にみていきます。注意することは、、、、点が重ならないように少しだけずらすことぐらいかなー。 ggplot(demo, aes(x = x1, y = y, shape = class, col = rank)) + geom_point(size = 5) + scale_shape_manual(values = c(4, 7)) + scale_…

第69回 ggplotの備忘録その6

今回は散布図を中心にみていきます。注意することは、、、、点が重ならないように少しだけずらすことぐらいかなー。 > ggplot(demo, aes(x = x1, y = y, shape = class, col = rank)) + geom_point(size = 5) + scale_shape_manual(values = c(4, 7)) + scal…

第66回 ggplotの備忘録その3

今回はggplot2で基本的なグラフを作成していくことが目的となります。基本的なグラフは、散布図、折れ線グラフ、棒グラフ、ヒストグラム、ボックスプロットなどです。ggplotの基本的な考え方については、この記事を参照ください。 sugisugirrr.hatenablog.co…

第66回 ggplotの備忘録その3

今回はggplot2で基本的なグラフを作成していくことが目的となります。基本的なグラフは、散布図、折れ線グラフ、棒グラフ、ヒストグラム、ボックスプロットなどです。ggplotの基本的な考え方については、この記事を参照ください。 sugisugirrr.hatenablog.co…

第65回 ggplotの備忘録その2

年末はグラフィックに集中してまとめていきます。個人的にRを使う時にグラフィック関係のコードをよく忘れてしまうので、備忘録として書いていきます。基礎の基礎から始めて、ggplotまで書く予定です。では、まずは基本的なものから見ていきましょう。それは…

第65回 ggplotの備忘録その2

年末はグラフィックに集中してまとめていきます。個人的にRを使う時にグラフィック関係のコードをよく忘れてしまうので、備忘録として書いていきます。基礎の基礎から始めて、ggplotまで書く予定です。では、まずは基本的なものから見ていきましょう。それは…

第64回 畳み込み(合成積) ~Convolution~

久しぶりの更新です。ベイズもやっていく予定ですが、年末はRのグラフィック関係についてまとめていくことにします。そうといいながらも今回は例外的に「畳み込み」についてみていきます。畳み込みは確率分布の導出過程を勉強しているとでてきます。カイ二乗…

第64回 畳み込み(合成積) ~Convolution~

久しぶりの更新です。ベイズもやっていく予定ですが、年末はRのグラフィック関係についてまとめていくことにします。そうといいながらも今回は例外的に「畳み込み」についてみていきます。畳み込みは確率分布の導出過程を勉強しているとでてきます。カイ二乗…

ベイズ統計学その2〜ベイズの定理〜

確率の基本はもろもろ省いて、さっそくベイズの定理から始めます。確率の基本がすごく大事ですが・・・勉強したいという方は、コルモゴロフの「確率論の基礎概念」や赤先生の「確率論入門」を読んでください。すごく勉強になります。余力あれば「測度論」と…

第63回 ggplot2の備忘録その1

第63回はggplot2の基本的概念について書いていきます。ggplot2は図を作成するための超強力なパッケージです。使い方さえ覚えてしまえば、簡単かつ効率良く作図できるようになります。 □ggplot2の用語と概念 ここでは、ggplot2におけるいくつかの用語の説明…

第63回 ggplot2の備忘録その1

第63回はggplot2の基本的概念について書いていきます。ggplot2は図を作成するための超強力なパッケージです。使い方さえ覚えてしまえば、簡単かつ効率良く作図できるようになります。 □ggplot2の用語と概念 ここでは、ggplot2におけるいくつかの用語の説明…

第62回 Time Seriesデータへの成型

Time Seriesデータへの成型 参考にするのは以下の書籍です。 www.shoeisha.co.jp さて、今回扱うデータ、コードは「楽しいR」のものを利用させてもらいます。目標は、曜日変数とtime lag変数の追加です。 □Time lagとは データをシフトして比較するときや、…