Rを通じて統計学を学ぶ備忘録ブログ

SPSSからRに移行したい私のような人向けのR解説ブログ兼学習用備忘録。

第66回 ggplotの備忘録その3

今回はggplot2で基本的なグラフを作成していくことが目的となります。基本的なグラフは、散布図、折れ線グラフ、棒グラフ、ヒストグラム、ボックスプロットなどです。ggplotの基本的な考え方については、この記事を参照ください。 sugisugirrr.hatenablog.co…

第66回 ggplotの備忘録その3

今回はggplot2で基本的なグラフを作成していくことが目的となります。基本的なグラフは、散布図、折れ線グラフ、棒グラフ、ヒストグラム、ボックスプロットなどです。ggplotの基本的な考え方については、この記事を参照ください。 sugisugirrr.hatenablog.co…

第65回 ggplotの備忘録その2

年末はグラフィックに集中してまとめていきます。個人的にRを使う時にグラフィック関係のコードをよく忘れてしまうので、備忘録として書いていきます。基礎の基礎から始めて、ggplotまで書く予定です。では、まずは基本的なものから見ていきましょう。それは…

第65回 ggplotの備忘録その2

年末はグラフィックに集中してまとめていきます。個人的にRを使う時にグラフィック関係のコードをよく忘れてしまうので、備忘録として書いていきます。基礎の基礎から始めて、ggplotまで書く予定です。では、まずは基本的なものから見ていきましょう。それは…

第64回 畳み込み(合成積) ~Convolution~

久しぶりの更新です。ベイズもやっていく予定ですが、年末はRのグラフィック関係についてまとめていくことにします。そうといいながらも今回は例外的に「畳み込み」についてみていきます。畳み込みは確率分布の導出過程を勉強しているとでてきます。カイ二乗…

第64回 畳み込み(合成積) ~Convolution~

久しぶりの更新です。ベイズもやっていく予定ですが、年末はRのグラフィック関係についてまとめていくことにします。そうといいながらも今回は例外的に「畳み込み」についてみていきます。畳み込みは確率分布の導出過程を勉強しているとでてきます。カイ二乗…

ベイズ統計学その2〜ベイズの定理〜

確率の基本はもろもろ省いて、さっそくベイズの定理から始めます。確率の基本がすごく大事ですが・・・勉強したいという方は、コルモゴロフの「確率論の基礎概念」や赤先生の「確率論入門」を読んでください。すごく勉強になります。余力あれば「測度論」と…

第63回 ggplot2の備忘録その1

第63回はggplot2の基本的概念について書いていきます。ggplot2は図を作成するための超強力なパッケージです。使い方さえ覚えてしまえば、簡単かつ効率良く作図できるようになります。 □ggplot2の用語と概念 ここでは、ggplot2におけるいくつかの用語の説明…

第63回 ggplot2の備忘録その1

第63回はggplot2の基本的概念について書いていきます。ggplot2は図を作成するための超強力なパッケージです。使い方さえ覚えてしまえば、簡単かつ効率良く作図できるようになります。 □ggplot2の用語と概念 ここでは、ggplot2におけるいくつかの用語の説明…

第62回 Time Seriesデータへの成型

Time Seriesデータへの成型 参考にするのは以下の書籍です。 www.shoeisha.co.jp さて、今回扱うデータ、コードは「楽しいR」のものを利用させてもらいます。目標は、曜日変数とtime lag変数の追加です。 □Time lagとは データをシフトして比較するときや、…

第62回 Time Seriesデータへの成型

Time Seriesデータへの成型 参考にするのは以下の書籍です。 www.shoeisha.co.jp さて、今回扱うデータ、コードは「楽しいR」のものを利用させてもらいます。目標は、曜日変数とtime lag変数の追加です。 □Time lagとは データをシフトして比較するときや、…

第61回 クラスター分析

□クラスター分析 クラスター分析とは、個体の類似性を(距離)をもとにいくつかのクラスター(房)に分け、集団の特徴を捉えるための分析手法。大別すると、デンドログラム(樹形図)で表現される「階層的」な方法と、あらかじめクラスターの数を固定し、そ…

第61回 クラスター分析

□クラスター分析 クラスター分析とは、個体の類似性を(距離)をもとにいくつかのクラスター(房)に分け、集団の特徴を捉えるための分析手法。大別すると、デンドログラム(樹形図)で表現される「階層的」な方法と、あらかじめクラスターの数を固定し、そ…

第60回 曜日の追加

第60回はデータセットへ曜日の追加について書いていきます。まさに本日の内容は備忘録。元データをエクセルで加工すれば、こんなことはしなくても良いのですが・・・・Rで実践。 sample <- read.csv("demo.csv",header=TRUE) sample day1 <- weekdays(as.D…

第60回 曜日の追加

R

第60回はデータセットへ曜日の追加について書いていきます。まさに本日の内容は備忘録。元データをエクセルで加工すれば、こんなことはしなくても良いのですが・・・・Rで実践。 sample <- read.csv("demo.csv",header=TRUE) sample day1 <- weekdays(as.D…

第59回 マルチレベル分析〜R実践〜

第59回はRでマルチレベル分析を行っていきます。用いるデータはマルチレベル分析の生みの親でもあるRaudenbushが実際に使った高校のデータを使っていきます。データはここからダウンロードできます。 □hsb12の内容 hsb12の内容は、高校をサンプリングした…

第59回 マルチレベル分析〜R実践〜

第59回はRでマルチレベル分析を行っていきます。用いるデータはマルチレベル分析の生みの親でもあるRaudenbushが実際に使った高校のデータを使っていきます。データはここからダウンロードできます。 □hsb12の内容 hsb12の内容は、高校をサンプリングした…

補足の回 重回帰分析の交互作用の検討 R実践

【お詫びのお知らせ】20160628 作図2:オンラインツール(Preacher, Curran, & Bauer, 2006)の箇所で入力に誤りがありましたので訂正いたしました。 今回は重回帰分析の交互作用の検討をRで実践してみます。前回も同様の記事を書きましたが、今回は地味に地…

補足の回 重回帰分析の交互作用の検討 R実践

【お詫びのお知らせ】20160628 作図2:オンラインツール(Preacher, Curran, & Bauer, 2006)の箇所で入力に誤りがありましたので訂正いたしました。 今回は重回帰分析の交互作用の検討をRで実践してみます。前回も同様の記事を書きましたが、今回は地味に地…

第58回 マルチレベル分析

第58回はマルチレベル分析について書いていきます。マルチレベル分析は、その名が表すように、複数の水準を分けて分析していく手法です。マルチレベル分析は、「マルチレベルモデル」「階層線形モデル」「線形混合モデル」など様々な呼び方をされている手…

第58回 マルチレベル分析

第58回はマルチレベル分析について書いていきます。マルチレベル分析は、その名が表すように、複数の水準を分けて分析していく手法です。マルチレベル分析は、「マルチレベルモデル」「階層線形モデル」「線形混合モデル」など様々な呼び方をされている手…

第57回 マルチレベル分析と分散分析

第57回はマルチレベル分析と分散分析について書きます。マルチレベル分析の理論を学ぶ中で、「級内相関」というものに出会います。級内相関の考え方は、分散分析の考え方に似ていると思ったので、分散分析をおさらいする復習回となります。詳しくは書きま…

第57回 マルチレベル分析と分散分析

第57回はマルチレベル分析と分散分析について書きます。マルチレベル分析の理論を学ぶ中で、「級内相関」というものに出会います。級内相関の考え方は、分散分析の考え方に似ていると思ったので、分散分析をおさらいする復習回となります。詳しくは書きま…

第56回 時系列データの視覚化

第56回は時系列データの視覚化について書きます。よくウェブとか広告効果の分析をしていると、cvとかimpressionとか呼ばれる指標と出会います。現在の仕事では、統計と無関係なので、私は出会いませんが・・・・笑 この指標は毎日のようにカウントされて具…

第56回 時系列データの視覚化

第56回は時系列データの視覚化について書きます。よくウェブとか広告効果の分析をしていると、cvとかimpressionとか呼ばれる指標と出会います。現在の仕事では、統計と無関係なので、私は出会いませんが・・・・笑 この指標は毎日のようにカウントされて具…

第55回 検定力分析

第55回は検定力分析について書いていきます。検定では、サンプルサイズ、有意水準、効果量、検定力を適切に検討しなければいけません。なぜなら、サンプルサイズが大きいと、有意な差が生まれやすくなってしまいますし、サンプルサイズが小さい、本当は差…

第55回 検定力分析

第55回は検定力分析について書いていきます。検定では、サンプルサイズ、有意水準、効果量、検定力を適切に検討しなければいけません。なぜなら、サンプルサイズが大きいと、有意な差が生まれやすくなってしまいますし、サンプルサイズが小さい、本当は差…

第54回 オイラーの等式&せん妄

第54回 オイラーの等式について書きます。 本日は、さんざんな1日でした。午前中はオイラーの等式(大部分はオイラー角)について話を先輩としていた反面、夕方からは突如簡単な計算や短期的に物事が記憶できなくなったり(頭がふわっとしていた)と、なん…

第54回 オイラーの等式&せん妄

第54回 オイラーの等式について書きます。 本日は、さんざんな1日でした。午前中はオイラーの等式(大部分はオイラー角)について話を先輩としていた反面、夕方からは突如簡単な計算や短期的に物事が記憶できなくなったり(頭がふわっとしていた)と、なん…

第53回 フィッシャー情報量

第53回はFisher情報量について書いていきます。辞書で調べてみると、「確率変数Xが母数θに対して持っている『情報』の量を表す」と書かれています。うーん・・・・わかるようでわからない。情報を持っているからどうなの?という疑問が生まれました(個人…

第53回 フィッシャー情報量

第53回はFisher情報量について書いていきます。辞書で調べてみると、「確率変数Xが母数θに対して持っている『情報』の量を表す」と書かれています。うーん・・・・わかるようでわからない。情報を持っているからどうなの?という疑問が生まれました(個人…

第52回 ポアソン回帰分析

第52回はポアソン回帰分析について書いていきます。これは見てわかる通り、誤差構造にポアソン分布を利用します。つまり、ポアソン回帰分析の目的変数は「ポアソン分布」に従います。従い、ポアソン分布に従って発生する観測値(y)に影響する要因(x)との…

第52回 ポアソン回帰分析

第52回はポアソン回帰分析について書いていきます。これは見てわかる通り、誤差構造にポアソン分布を利用します。つまり、ポアソン回帰分析の目的変数は「ポアソン分布」に従います。従い、ポアソン分布に従って発生する観測値(y)に影響する要因(x)との…

第51回 多項(Multi)ロジスティック回帰分析

第51回は「多項ロジスティック回帰分析」。これはどのようなときに使う手法なのでしょうか。簡単に言うと、名義尺度の目的変数が3つ以上のとき、多項ロジスティック回帰分析、目的変数に順序関係がある場合には順序ロジスティック回帰分析(もしくは、順序…

第51回 多項(Multi)ロジスティック回帰分析

第51回は「多項ロジスティック回帰分析」。これはどのようなときに使う手法なのでしょうか。簡単に言うと、名義尺度の目的変数が3つ以上のとき、多項ロジスティック回帰分析、目的変数に順序関係がある場合には順序ロジスティック回帰分析(もしくは、順序…

第50回 プロビット回帰分析

第50回はロジスティックとプロビットの関係について書いていきます。ロジスティック回帰分析のことを調べると、爾汝の交わりのようにつきまとってくるプロビットという言葉。「プロビット」って何者なのでしょうか。 ・許容値分布 2値変数を扱う場合はロ…

第50回 プロビット回帰分析

第50回はロジスティックとプロビットの関係について書いていきます。ロジスティック回帰分析のことを調べると、爾汝の交わりのようにつきまとってくるプロビットという言葉。「プロビット」って何者なのでしょうか。 ・許容値分布 2値変数を扱う場合はロ…

第49回 ロジスティック回帰分析(R実践)

第49回はロジスティック回帰分析をRで実践していきます。データセットのサンプルは、以前の記事でも使わせていただいた「マンガでわかる統計学〜回帰分析〜」をもとにしております。書籍では、ノルンという喫茶店の「スペシャルケーキ」が売れるかどうかを…

第49回 ロジスティック回帰分析(R実践)

第49回はロジスティック回帰分析をRで実践していきます。データセットのサンプルは、以前の記事でも使わせていただいた「マンガでわかる統計学〜回帰分析〜」をもとにしております。書籍では、ノルンという喫茶店の「スペシャルケーキ」が売れるかどうかを…

第48回 ロジスティック回帰分析

第48回はロジスティック回帰分析について書きます。ロジスティック回帰分析を簡単に説明すると、目的変数が「2値」の時に利用する分析手法です。例えば、売れる/売れない、勝つ/負ける、投票する/投票しない、発生する/発生しない、0/1、などなどです。普…

第48回 ロジスティック回帰分析

第48回はロジスティック回帰分析について書きます。ロジスティック回帰分析を簡単に説明すると、目的変数が「2値」の時に利用する分析手法です。例えば、売れる/売れない、勝つ/負ける、投票する/投票しない、発生する/発生しない、0/1、などなどです。普…

第47回 最尤推定法〜正規分布、二項分布、ポアソン分布〜

第47回は、最尤推定量(正規分布、二項分布、ポアソン分布)の計算過程について書いていきます。最尤推定法については以前の記事を参照願います。 ・二項分布 二項分布の確率質量関数は以下の通りです。 対数をとって、微分して、0とおく。これが一連の流…

第47回 最尤推定法〜正規分布、二項分布、ポアソン分布〜

第47回は、最尤推定量(正規分布、二項分布、ポアソン分布)の計算過程について書いていきます。最尤推定法については以前の記事を参照願います。 ・二項分布 二項分布の確率質量関数は以下の通りです。 対数をとって、微分して、0とおく。これが一連の流…

第46回の補足の補足 重回帰分析×交互作用項(質的×質的)

第46回で交互作用と重回帰分析について書きましたが、それの補足記事です。説明変数が、質的×質的の交互作用項を含めた場合、どのように係数を解釈すればよいのでしょうか。 例を示して説明します。性別によって生活する国が幸福度に与える影響を明らかに…

第46回の補足の補足 重回帰分析×交互作用項(質的×質的)

第46回で交互作用と重回帰分析について書きましたが、それの補足記事です。 説明変数が、質的×質的の交互作用項を含めた場合、どのように係数を解釈すればよいのでしょうか。 例を示して説明します。性別によって生活する国が幸福度に与える影響を明らかに…

二項検定と大阪ダービー(ガンバ大阪 vs. セレッソ大阪)

今回は二項検定を使って、サッカーJ1リーグ、ガンバ大阪とセレッソ大阪のどちらが強いのかを検定してみたいと思います。 二項検定とは、試合に勝つ・負けるというような2値しかとらない変数を対象とする検定法です。これまで、ガンバ大阪とセレッソ大阪の通…

二項検定と大阪ダービー(ガンバ大阪 vs. セレッソ大阪)

今回は二項検定を使って、サッカーJ1リーグ、ガンバ大阪とセレッソ大阪のどちらが強いのかを検定してみたいと思います。 二項検定とは、試合に勝つ・負けるというような2値しかとらない変数を対象とする検定法です。これまで、ガンバ大阪とセレッソ大阪の通…

第45回 重回帰分析と交互作用

第44回の補足 階層的重回帰分析について書きます。 階層的重回帰分析は、階層構造をもたせてモデルを構築することで、説明力が増加するかどうかや、変数間の媒介関係を検討することを目的としている回帰分析です。 □階層的重回帰分析の考え方 変数間の媒介…

第45回 重回帰分析と交互作用

第45回の補足では、重回帰分析と交互作用について書きます。 20150810時点で訂正しました。 数式解説の部分、mとzが混同しておりました。ただしくはmです。 申し訳ありません。 20150927時点:以下の記事を追加しました。 ・交互作用とは 重回帰分析では交…

第44回 階層的重回帰分析

第44回の補足 階層的重回帰分析について書きます。 階層的重回帰分析は、階層構造をもたせてモデルを構築することで、説明力が増加するかどうかや、変数間の媒介関係を検討することを目的としている回帰分析です。 □階層的重回帰分析の考え方 変数間の媒介…