Rを通じて統計学を学ぶ備忘録ブログ

SPSSからRに移行したい私のような人向けのR解説ブログ兼学習用備忘録。

多変量解析

第45回 重回帰分析と交互作用

第44回の補足 階層的重回帰分析について書きます。 階層的重回帰分析は、階層構造をもたせてモデルを構築することで、説明力が増加するかどうかや、変数間の媒介関係を検討することを目的としている回帰分析です。 □階層的重回帰分析の考え方 変数間の媒介…

第44回 階層的重回帰分析

第44回の補足 階層的重回帰分析について書きます。 階層的重回帰分析は、階層構造をもたせてモデルを構築することで、説明力が増加するかどうかや、変数間の媒介関係を検討することを目的としている回帰分析です。 □階層的重回帰分析の考え方 変数間の媒介…

第43回 変数間の関連パターン

第43回は変数間の関連について書きます。次回、重回帰分析の「階層的」重回帰分析の記事を書くために、変数間の「媒介関係」をおさえましょう。次いでに「疑似相関」「交互作用」についてもおさえておきましょう。 □媒介関係 xが原因変数、yが結果変数とし…

第43回 変数間の関連パターン

第43回は変数間の関連について書きます。次回、重回帰分析の「階層的」重回帰分析の記事を書くために、変数間の「媒介関係」をおさえましょう。次いでに「疑似相関」「交互作用」についてもおさえておきましょう。 □媒介関係 xが原因変数、yが結果変数とし…

第41回 AIC

第41回はAICについて書きます。 以前の記事でもモデル選択の記事でAICはちらっと紹介しましたが、今回はAICに焦点をあてて書いていきます。数式はほとんど使いません。 □AICの考え方 モデル選択では、問題意識として、どのような統計モデルを選択するべき…

第40回 パラメタ推定法(最尤法) 

第40回はパラメタ推定法(最尤法)について書きます。 パラメタの推定法はいくつかありますが、回帰分析では特に指定がない限り、「最小二乗法」を使ってパラメタを推定します。しかし、回帰分析の種類によっては、最小二乗法でパラメタを求めることが好ま…

第39回 一般化線形モデル

第39回は一般化線形モデルの概要について書いていきます。 □一般化線形モデルとは!? 一般化線形モデル(Generalized linear model:GLM、以下GLM)は、1972年にネルダーとウェダーバーンによって提唱されました。線形回帰分析では正規分布を使うこと…

第39回 一般化線形モデル

一般化線形モデルとは!? 一般化線形モデル(Generalized linear model:GLM、以下GLM)は、1972年にネルダーとウェダーバーンによって提唱されました理論のことです。一般的によく耳にする線形回帰分析とは、裏側で正規分布を仮定しているものに限られ…

第38回 因子分析

第38回は因子分析について書きます。 そもそも因子分析は、「探索的因子分析」と「検証的因子分析」の2つに分けられます。ここでは、「探索的因子分析」のことについて書いていきます。 因子分析は端的に言うと、「データの背後に存在するであろう説明変…

第38回 因子分析

第38回は因子分析について書きます。 そもそも因子分析は、「探索的因子分析」と「検証的因子分析」の2つに分けられます。ここでは、「探索的因子分析」のことについて書いていきます。 因子分析は端的に言うと、「データの背後に存在するであろう説明変…

第37回 主成分分析

第37回は主成分分析について書きます。 主成分分析と因子分析はセットで語られることが多く、似たような分析法というイメージが強いのですが、目的が違います。主成分分析は「情報をまとめること」を目的としており、因子分析のように変数の背後にある潜在…

第37回 主成分分析

第37回は主成分分析について書きます。 主成分分析と因子分析はセットで語られることが多く、似たような分析法というイメージが強いのですが、目的が違います。主成分分析は「情報をまとめること」を目的としており、因子分析のように変数の背後にある潜在…

第36回 非線形回帰分析

第36回は非線形回帰分析について書きます。 これまでは線形回帰分析について書いてきました。線形回帰分析とは、目的変数を説明変数の線形関係で表すことでした。一方、非線形回帰分析では、目的変数を説明変数の非線形関係で表します。 例えば、標準シグ…

第35回 モデル選択

第35回はモデル選択について書きます。前回の記事で、重回帰分析では変数の選択が重要とかきました。そこで今回は、変数の有効な選択法について書いていきます。 変数選択法には大きく3つあります。 ①変数増加法:説明変数1つから順次増やしていく ②変数…

第35回 モデル選択

第35回はモデル選択について書きます。前回の記事で、重回帰分析では変数の選択が重要とかきました。そこで今回は、変数の有効な選択法について書いていきます。 変数選択法には大きく3つあります。 ①変数増加法:説明変数1つから順次増やしていく ②変数…

第34回 重回帰分析

第34回は重回帰分析について書きます。 重回帰分析は単回帰分析の説明変数が1つではなく、複数になったものです。単回帰分析のときには問題にならなかった「多重共線性(マルチコリニアリティ)」ということを考慮しなければいけません。 多重共線性:回…

第34回 重回帰分析

第34回は重回帰分析について書きます。 重回帰分析は単回帰分析の説明変数が1つではなく、複数になったものです。単回帰分析のときには問題にならなかった「多重共線性(マルチコリニアリティ)」ということを考慮しなければいけません。 多重共線性:回…

第33回 適合度検定

第33回は適合度の検定について書きます。 ブログのアクセス解析をみていると、なぜか第23回 カイ二乗検定 - SPSS→R備忘録ブログ(正確には、独立性の検定のほうがいいかな)が一番アクセス数が多いみたいなので、それに関連する「適合度検定」について書くこと…

第31回 回帰分析の信頼区間・予測区間

第31回は回帰分析の信頼区間・予測区間について書きます。 前回は、母平均の信頼区間についてかきましたが、回帰分析では、母回帰の推定を行うことになります。信頼区間の解釈は前回記事と同じです。予測区間とは、xの値は信頼率○%でいくつ以上、いくつ以…

第31回 回帰分析と重回帰分析

第31回は回帰分析と重回帰分析について書きます。 説明変数が 1つの場合=単回帰分析 説明変数が 2つ以上の場合=重回帰分析 線形回帰、非線形回帰に回帰分析は分類できるが、「線形」回帰の由来は「yとxの関係を直線で表せる」からである。まずは単回帰…

第31回 回帰分析と重回帰分析

回帰分析と重回帰分析 説明変数が 1つの場合=単回帰分析 説明変数が 2つ以上の場合=重回帰分析 基本的に線形回帰、非線形回帰に回帰分析は分類できるのですが、「線形」回帰の由来は「yとxの関係を直線で表せる」からです。まずは単回帰分析の大まかな特…

第13回の補足 2変量以上の相関係数 

第13回の補足では2変量の相関係数について書きます。 相関係数が2変数(データセットでは2列)の場合、cor(x,y)と簡単に相関係数を求めることができましたが、変数が10列、20列と多い場合はどうすればよいでしょうか。1つ1つ、組み合わせて係数を求めて…

第28回 二元配置分散分析(対応なし)

第28回は二元配置分散分析(対応なし)について書きます。 2つの条件の組み合わせによって母平均が異なるかどうかを検定します。例えば、教室A、Bがあり、教室Aの中でも生徒数を10人クラス、20人クラス、30人クラスと分け、教室Bでも同様に振り分ける。教…

第27回 分散分析(対応あり)

第27回は分散分析(対応あり)について書きます。 対応のある分散分析としていきましょう。 対応のある分散分析は例えば、食品a、b、cの美味しさを測定するときに、食品aを1〜5の人に食べてもらい、食品b、食品cも同様に1〜5の人に食べてもらいます。つま…

第26回 分散分析(対応なし)

第26回は分散分析(対応なし)について書きます。 分散分析は3郡以上の母集団の平均値の検定のことです。 例えば、A,B,Cという3郡の母平均は等しいという帰無仮説を設定し、検定します。 ここでAとB,BとC,CとAに分けてt検定を行えば良いのでは??と考える…

第25回 t検定

第25回はt検定について書きます。 t検定は、2群の母集団の平均値が同じかどうかの検定です。t.test()関数を使用して、 デフォルトで引数 var.equal=FALSE が指定され、ウェルチのt検定(非等分散のt検定)が設定されています。var.equal=TRUE とすると等分…

第24回 カイ二乗検定とサンプルサイズのいけない関係

第24回 カイ二乗検定とサンプルサイズの関係について書きます。 small 今回の検定では、互いの変数は「独立」でないことがわかりました。つまり、関連する。 標本の関係性が同じでも、サンプルサイズが大きくなると、検定は有意になりやすくなります。これ…

第22回 無相関検定

第22回は無相関検定についてか書きます。 この検定は、帰無仮説を「母集団において相関係数が=0」と設定し、仮説検定を行います。使用するデータは、第12回と同じ。cor.test関数を利用しする。カッコ内でmethod=以下を指定することで変更できる。 "pear…

第13回 2変数の要約

第13回は2変数の要約について書きます。 まずは量的な変数間の関係を見るために、散布図を書きます。データセットは前回と同じです。