読者です 読者をやめる 読者になる 読者になる

Rを通じて統計学を学ぶ備忘録ブログ

SPSSからRに移行したい私のような人向けのR解説ブログ兼学習用備忘録。

第45回 重回帰分析と交互作用

R 多変量解析

第45回の補足では、重回帰分析と交互作用について書きます。

20150810時点で訂正しました。

数式解説の部分、mとzが混同しておりました。ただしくはmです。

申し訳ありません。

 

20150927時点:以下の記事を追加しました。

・交互作用とは

重回帰分析では交互作用を検討することも可能です。交互作用は前回の記事でもかきましたが、以下の図のような影響関係を持ちます。

f:id:teruaki-sugiura:20150808230401p:plain

xとyは関連をしているが、zを追加することで、yへの影響がzの値によって変化するような状態のことです。xは、zによって条件づけられた効果であるため、「条件付き効果」とよばれます。z=0のとき、xのの影響を「主効果」と呼びます。

・交互作用の図解

具体的な事例を図を使いながら説明してみます。内容は高校野球が盛り上がっているので、野球を例にします。もちろん、架空のデータですし、あくまで説明用なので、変数の曖昧さに関しての痛烈なツッコミは御遠慮ください。

 

f:id:teruaki-sugiura:20150809164112p:plain

長時間練習をすれば試合での得点力が高くなることは容易に想像できますが、どんな内容の練習でもこうなるのでしょうか。そこで、バッティングの練習(練習B)、走り込みの練習(練習A)に分けて得点に関する影響が異なるのかどうかを検討してみたい。そんなときに重回帰分析の交互作用は役に立ちます。 

・数式解説

単純な交互作用を検討する回帰分析(説明変数が2つ)の場合、以下のように表現できます。

y:目的変数

x:説明変数

m:調整変数(Moderator)

xm:交互作用項

ε:誤差項

(1)f:id:teruaki-sugiura:20150809164301p:plain    

交互作用の効果を表す変数項は「xとmの積=xm」で表されます。(1)式を変形すると(2)式になります。

(2)f:id:teruaki-sugiura:20150809164357p:plain

この式のxの係数部分をみてみると、mの値が変化することによって、yへの影響がことなることがわかります。また、ここでmを含めなければいけない理由を考えてみましょう。仮にmを投入しないと以下の(3)式になってしまいます。mを投入した(4)式、(4)式を変形した(5)式と比較してみましょう。

(3)f:id:teruaki-sugiura:20150809164650p:plain 

(4)f:id:teruaki-sugiura:20150809164722p:plain

(5)f:id:teruaki-sugiura:20150809164942p:plain

mを投入しないことで、切片がmの値に関係なく等しいと考えていることになります。また、mを含めなければ、場合によっては交互作用を適切に評価できなくなってしまいます。また、交互作用項は多くない方が賢明です。多くなりすぎると、解釈が困難になります。

・調整変数mの尺度

質的変数の場合は、ダミー変数化し、xとの積をとれば問題ありません。量的変数でもxとの積をとれば、こちらも問題はありません。しかし、結果の解釈が異なりますので注意が必要です。質的変数の場合、xの主効果はm=0のときの効果を表します。質的変数の場合も、xの主効果はm=0のときの効果を表しますが、調整変数の取りうる値に「0」が含まれていない場合、主効果が解釈できない値になってしまいます。

そのため、調整変数を「センタリング」し、分析結果を解釈する際には、実際にとりうる値を代入することで、解釈しやすくするなどが必要です。また、交互作用項との多重共線性をさけるためにも、センタリングしておきましょう。

※センタリング:連続量の平均値から偏差をとること(センタリング = 各xの値ーxの平均)

・下位検定

分散分析のときと同様に交互作用を検討したあとは、下位検定を行いましょう。分析の結果、xmが有意であれば単純傾斜分析 (Simple Slope Analysis)を行います。 調整変数の任意の値をいくつか選び,x の傾きがゼロと異なるかどうかを検討します。任意の値は、調整変数 の平均±1SD の値を選択します。

以上で第45回の補足はおしまい。

広告を非表示にする