読者です 読者をやめる 読者になる 読者になる

Rを通じて統計学を学ぶ備忘録ブログ

SPSSからRに移行したい私のような人向けのR解説ブログ兼学習用備忘録。

多変量解析

第78回 ブートストラップ法

今回はブートストラップ法について見ていきましょう。ブートストラップ法はモンテカルロ法の一種で、標本から標本を再抽出することで、母集団の性質を推測する方法のことです。観測されたサンプルデータから母集団の性質を推測するとき、必ず誤差が生じてい…

第78回 ブートストラップ法

今回はブートストラップ法について見ていきましょう。ブートストラップ法はモンテカルロ法の一種で、標本から標本を再抽出することで、母集団の性質を推測する方法のことです。観測されたサンプルデータから母集団の性質を推測するとき、必ず誤差が生じてい…

第76回 重回帰分析と交互作用〜説明変数が2つ以上の時の作図〜

久しぶりの更新です。このブログのアクセス解析ページを見てみると、重回帰分析と交互作用のページへのアクセスが多いようなので、それに関連するトピックで記事を書いていきます。過去の関連記事は以下から参照ください。 第31回 回帰分析と重回帰分析 - …

第76回 重回帰分析と交互作用〜説明変数が2つ以上の時の作図〜

久しぶりの更新です。このブログのアクセス解析ページを見てみると、重回帰分析と交互作用のページへのアクセスが多いようなので、それに関連するトピックで記事を書いていきます。過去の関連記事は以下から参照ください。 第31回 回帰分析と重回帰分析 - …

第75回 ポリコリック相関係数・ポリシリアル相関係数

ポリコリック相関係数のp_11~p_00のp_00の式に誤りがありましたので、修正しました。(2016年2月21日) ポリコリック相関係数・ポリシリアル相関係数 カテゴリ変数の関係をみようとすると、これまではスピアマンの順位相関係数とかケンドールの順位相関係数…

第74回 ポアソン分布とサッカーのゴール数

今回は、ポアソン分布とサッカーのゴール数の関係をもとに、基本的なポアソン分布の説明から、オフセットと過分散も検討したポアソン回帰までみていきます。 ポアソン分布 サッカーのゴール数がポアソン分布に従うことは有名な話ですね。そもそもポアソン分…

第62回 Time Seriesデータへの成型

Time Seriesデータへの成型 参考にするのは以下の書籍です。 www.shoeisha.co.jp さて、今回扱うデータ、コードは「楽しいR」のものを利用させてもらいます。目標は、曜日変数とtime lag変数の追加です。 □Time lagとは データをシフトして比較するときや、…

第61回 クラスター分析

□クラスター分析 クラスター分析とは、個体の類似性を(距離)をもとにいくつかのクラスター(房)に分け、集団の特徴を捉えるための分析手法。大別すると、デンドログラム(樹形図)で表現される「階層的」な方法と、あらかじめクラスターの数を固定し、そ…

第61回 クラスター分析

□クラスター分析 クラスター分析とは、個体の類似性を(距離)をもとにいくつかのクラスター(房)に分け、集団の特徴を捉えるための分析手法。大別すると、デンドログラム(樹形図)で表現される「階層的」な方法と、あらかじめクラスターの数を固定し、そ…

第59回 マルチレベル分析〜R実践〜

第59回はRでマルチレベル分析を行っていきます。用いるデータはマルチレベル分析の生みの親でもあるRaudenbushが実際に使った高校のデータを使っていきます。データはここからダウンロードできます。 □hsb12の内容 hsb12の内容は、高校をサンプリングした…

第59回 マルチレベル分析〜R実践〜

第59回はRでマルチレベル分析を行っていきます。用いるデータはマルチレベル分析の生みの親でもあるRaudenbushが実際に使った高校のデータを使っていきます。データはここからダウンロードできます。 □hsb12の内容 hsb12の内容は、高校をサンプリングした…

補足の回 重回帰分析の交互作用の検討 R実践

【お詫びのお知らせ】20160628 作図2:オンラインツール(Preacher, Curran, & Bauer, 2006)の箇所で入力に誤りがありましたので訂正いたしました。 今回は重回帰分析の交互作用の検討をRで実践してみます。前回も同様の記事を書きましたが、今回は地味に地…

補足の回 重回帰分析の交互作用の検討 R実践

【お詫びのお知らせ】20160628 作図2:オンラインツール(Preacher, Curran, & Bauer, 2006)の箇所で入力に誤りがありましたので訂正いたしました。 今回は重回帰分析の交互作用の検討をRで実践してみます。前回も同様の記事を書きましたが、今回は地味に地…

第58回 マルチレベル分析

第58回はマルチレベル分析について書いていきます。マルチレベル分析は、その名が表すように、複数の水準を分けて分析していく手法です。マルチレベル分析は、「マルチレベルモデル」「階層線形モデル」「線形混合モデル」など様々な呼び方をされている手…

第58回 マルチレベル分析

第58回はマルチレベル分析について書いていきます。マルチレベル分析は、その名が表すように、複数の水準を分けて分析していく手法です。マルチレベル分析は、「マルチレベルモデル」「階層線形モデル」「線形混合モデル」など様々な呼び方をされている手…

第57回 マルチレベル分析と分散分析

第57回はマルチレベル分析と分散分析について書きます。マルチレベル分析の理論を学ぶ中で、「級内相関」というものに出会います。級内相関の考え方は、分散分析の考え方に似ていると思ったので、分散分析をおさらいする復習回となります。詳しくは書きま…

第56回 時系列データの視覚化

第56回は時系列データの視覚化について書きます。よくウェブとか広告効果の分析をしていると、cvとかimpressionとか呼ばれる指標と出会います。現在の仕事では、統計と無関係なので、私は出会いませんが・・・・笑 この指標は毎日のようにカウントされて具…

第52回 ポアソン回帰分析

第52回はポアソン回帰分析について書いていきます。これは見てわかる通り、誤差構造にポアソン分布を利用します。つまり、ポアソン回帰分析の目的変数は「ポアソン分布」に従います。従い、ポアソン分布に従って発生する観測値(y)に影響する要因(x)との…

第52回 ポアソン回帰分析

第52回はポアソン回帰分析について書いていきます。これは見てわかる通り、誤差構造にポアソン分布を利用します。つまり、ポアソン回帰分析の目的変数は「ポアソン分布」に従います。従い、ポアソン分布に従って発生する観測値(y)に影響する要因(x)との…

第51回 多項(Multi)ロジスティック回帰分析

第51回は「多項ロジスティック回帰分析」。これはどのようなときに使う手法なのでしょうか。簡単に言うと、名義尺度の目的変数が3つ以上のとき、多項ロジスティック回帰分析、目的変数に順序関係がある場合には順序ロジスティック回帰分析(もしくは、順序…

第51回 多項(Multi)ロジスティック回帰分析

第51回は「多項ロジスティック回帰分析」。これはどのようなときに使う手法なのでしょうか。簡単に言うと、名義尺度の目的変数が3つ以上のとき、多項ロジスティック回帰分析、目的変数に順序関係がある場合には順序ロジスティック回帰分析(もしくは、順序…

第50回 プロビット回帰分析

第50回はロジスティックとプロビットの関係について書いていきます。ロジスティック回帰分析のことを調べると、爾汝の交わりのようにつきまとってくるプロビットという言葉。「プロビット」って何者なのでしょうか。 ・許容値分布 2値変数を扱う場合はロ…

第49回 ロジスティック回帰分析(R実践)

第49回はロジスティック回帰分析をRで実践していきます。データセットのサンプルは、以前の記事でも使わせていただいた「マンガでわかる統計学〜回帰分析〜」をもとにしております。書籍では、ノルンという喫茶店の「スペシャルケーキ」が売れるかどうかを…

第49回 ロジスティック回帰分析(R実践)

第49回はロジスティック回帰分析をRで実践していきます。データセットのサンプルは、以前の記事でも使わせていただいた「マンガでわかる統計学〜回帰分析〜」をもとにしております。書籍では、ノルンという喫茶店の「スペシャルケーキ」が売れるかどうかを…

第48回 ロジスティック回帰分析

第48回はロジスティック回帰分析について書きます。ロジスティック回帰分析を簡単に説明すると、目的変数が「2値」の時に利用する分析手法です。例えば、売れる/売れない、勝つ/負ける、投票する/投票しない、発生する/発生しない、0/1、などなどです。普…

第48回 ロジスティック回帰分析

第48回はロジスティック回帰分析について書きます。ロジスティック回帰分析を簡単に説明すると、目的変数が「2値」の時に利用する分析手法です。例えば、売れる/売れない、勝つ/負ける、投票する/投票しない、発生する/発生しない、0/1、などなどです。普…

第47回 最尤推定法〜正規分布、二項分布、ポアソン分布〜

第47回は、最尤推定量(正規分布、二項分布、ポアソン分布)の計算過程について書いていきます。最尤推定法については以前の記事を参照願います。 ・二項分布 二項分布の確率質量関数は以下の通りです。 対数をとって、微分して、0とおく。これが一連の流…

第46回の補足の補足 重回帰分析×交互作用項(質的×質的)

第46回で交互作用と重回帰分析について書きましたが、それの補足記事です。 説明変数が、質的×質的の交互作用項を含めた場合、どのように係数を解釈すればよいのでしょうか。 例を示して説明します。性別によって生活する国が幸福度に与える影響を明らかに…

第46回の補足の補足 重回帰分析×交互作用項(質的×質的)

第46回で交互作用と重回帰分析について書きましたが、それの補足記事です。説明変数が、質的×質的の交互作用項を含めた場合、どのように係数を解釈すればよいのでしょうか。 例を示して説明します。性別によって生活する国が幸福度に与える影響を明らかに…

第45回 重回帰分析と交互作用

第45回の補足では、重回帰分析と交互作用について書きます。 20150810時点で訂正しました。 数式解説の部分、mとzが混同しておりました。ただしくはmです。 申し訳ありません。 20150927時点:以下の記事を追加しました。 ・交互作用とは 重回帰分析では交…

第45回 重回帰分析と交互作用

第44回の補足 階層的重回帰分析について書きます。 階層的重回帰分析は、階層構造をもたせてモデルを構築することで、説明力が増加するかどうかや、変数間の媒介関係を検討することを目的としている回帰分析です。 □階層的重回帰分析の考え方 変数間の媒介…

第44回 階層的重回帰分析

第44回の補足 階層的重回帰分析について書きます。 階層的重回帰分析は、階層構造をもたせてモデルを構築することで、説明力が増加するかどうかや、変数間の媒介関係を検討することを目的としている回帰分析です。 □階層的重回帰分析の考え方 変数間の媒介…

第43回 変数間の関連パターン

第43回は変数間の関連について書きます。次回、重回帰分析の「階層的」重回帰分析の記事を書くために、変数間の「媒介関係」をおさえましょう。次いでに「疑似相関」「交互作用」についてもおさえておきましょう。 □媒介関係 xが原因変数、yが結果変数とし…

第43回 変数間の関連パターン

第43回は変数間の関連について書きます。次回、重回帰分析の「階層的」重回帰分析の記事を書くために、変数間の「媒介関係」をおさえましょう。次いでに「疑似相関」「交互作用」についてもおさえておきましょう。 □媒介関係 xが原因変数、yが結果変数とし…

第41回 AIC

第41回はAICについて書きます。 以前の記事でもモデル選択の記事でAICはちらっと紹介しましたが、今回はAICに焦点をあてて書いていきます。数式はほとんど使いません。 □AICの考え方 モデル選択では、問題意識として、どのような統計モデルを選択するべき…

第40回 パラメタ推定法(最尤法) 

第40回はパラメタ推定法(最尤法)について書きます。 パラメタの推定法はいくつかありますが、回帰分析では特に指定がない限り、「最小二乗法」を使ってパラメタを推定します。しかし、回帰分析の種類によっては、最小二乗法でパラメタを求めることが好ま…

第39回 一般化線形モデル

第39回は一般化線形モデルの概要について書いていきます。 □一般化線形モデルとは!? 一般化線形モデル(Generalized linear model:GLM、以下GLM)は、1972年にネルダーとウェダーバーンによって提唱されました。線形回帰分析では正規分布を使うこと…

第39回 一般化線形モデル

一般化線形モデルとは!? 一般化線形モデル(Generalized linear model:GLM、以下GLM)は、1972年にネルダーとウェダーバーンによって提唱されました理論のことです。一般的によく耳にする線形回帰分析とは、裏側で正規分布を仮定しているものに限られ…

第38回 因子分析

第38回は因子分析について書きます。 そもそも因子分析は、「探索的因子分析」と「検証的因子分析」の2つに分けられます。ここでは、「探索的因子分析」のことについて書いていきます。 因子分析は端的に言うと、「データの背後に存在するであろう説明変…

第38回 因子分析

第38回は因子分析について書きます。 そもそも因子分析は、「探索的因子分析」と「検証的因子分析」の2つに分けられます。ここでは、「探索的因子分析」のことについて書いていきます。 因子分析は端的に言うと、「データの背後に存在するであろう説明変…

第37回 主成分分析

第37回は主成分分析について書きます。 主成分分析と因子分析はセットで語られることが多く、似たような分析法というイメージが強いのですが、目的が違います。主成分分析は「情報をまとめること」を目的としており、因子分析のように変数の背後にある潜在…

第37回 主成分分析

第37回は主成分分析について書きます。 主成分分析と因子分析はセットで語られることが多く、似たような分析法というイメージが強いのですが、目的が違います。主成分分析は「情報をまとめること」を目的としており、因子分析のように変数の背後にある潜在…

第36回 非線形回帰分析

第36回は非線形回帰分析について書きます。 これまでは線形回帰分析について書いてきました。線形回帰分析とは、目的変数を説明変数の線形関係で表すことでした。一方、非線形回帰分析では、目的変数を説明変数の非線形関係で表します。 例えば、標準シグ…

第35回 モデル選択

第35回はモデル選択について書きます。前回の記事で、重回帰分析では変数の選択が重要とかきました。そこで今回は、変数の有効な選択法について書いていきます。 変数選択法には大きく3つあります。 ①変数増加法:説明変数1つから順次増やしていく ②変数…

第35回 モデル選択

第35回はモデル選択について書きます。前回の記事で、重回帰分析では変数の選択が重要とかきました。そこで今回は、変数の有効な選択法について書いていきます。 変数選択法には大きく3つあります。 ①変数増加法:説明変数1つから順次増やしていく ②変数…

第34回 重回帰分析

第34回は重回帰分析について書きます。 重回帰分析は単回帰分析の説明変数が1つではなく、複数になったものです。単回帰分析のときには問題にならなかった「多重共線性(マルチコリニアリティ)」ということを考慮しなければいけません。 多重共線性:回…

第34回 重回帰分析

第34回は重回帰分析について書きます。 重回帰分析は単回帰分析の説明変数が1つではなく、複数になったものです。単回帰分析のときには問題にならなかった「多重共線性(マルチコリニアリティ)」ということを考慮しなければいけません。 多重共線性:回…

第33回 適合度検定

第33回は適合度の検定について書きます。 ブログのアクセス解析をみていると、なぜか第23回 カイ二乗検定 - SPSS→R備忘録ブログ(正確には、独立性の検定のほうがいいかな)が一番アクセス数が多いみたいなので、それに関連する「適合度検定」について書くこと…

第31回 回帰分析の信頼区間・予測区間

第31回は回帰分析の信頼区間・予測区間について書きます。 前回は、母平均の信頼区間についてかきましたが、回帰分析では、母回帰の推定を行うことになります。信頼区間の解釈は前回記事と同じです。予測区間とは、xの値は信頼率○%でいくつ以上、いくつ以…

第31回 回帰分析と重回帰分析

第31回は回帰分析と重回帰分析について書きます。 説明変数が 1つの場合=単回帰分析 説明変数が 2つ以上の場合=重回帰分析 線形回帰、非線形回帰に回帰分析は分類できるが、「線形」回帰の由来は「yとxの関係を直線で表せる」からである。まずは単回帰…