Rを通じて統計学を学ぶ備忘録ブログ

SPSSからRに移行したい私のような人向けのR解説ブログ兼学習用備忘録。

ちょっとした備忘録のページ。

x set.seed(71) dat dat a b c 1 3 1 6 2 5 7 2 3 3 1 7 4 2 7 2 5 3 8 1 6 9 7 4 7 6 1 4 8 8 8 3 9 3 8 2 10 4 9 8 #a列で重複している行を削除 dat[!duplicated(dat$a), ] a b c 1 3 1 6 2 5 7 2 4 2 7 2 6 9 7 4 7 6 1 4 8 8 8 3 10 4 9 8 #b,c列の組み…

大学の時にもっと勉強しておけばよかったマーケティング・リサーチ〜その11〜

アソシエーション分析(Association analysis) 今回は、アソシエーション分析について見ていきます。「おむつを買った人はビールを買う傾向がある(という伝説)」という話を、一度は聞いたことがあると思います。これは、マーケットバスケット分析の事例で、…

大学の時にもっと勉強しておけばよかったマーケティング・リサーチ〜その10〜

大学の時にもっと勉強しておけばよかったマーケティング・リサーチの10話目です。今回はRMF分析です。 CRMを利用したマイクロマーケティング 今回はRFM分析について見ていきます。RFM分析は、CRM(Customer Relationship Management)における分析手法の1つで…

大学の時にもっと勉強しておけばよかったマーケティング・リサーチ〜その9〜

大学の時にもっと勉強しておけばよかったマーケティング・リサーチの9話目です。今回は、コンジョイント分析です。 コンジョイント分析(Conjoint Analysis) コンジョイント分析は、1980年頃にアメリカで導入され始めた分析手法で、ユーザーが好むであろう商…

大学の時にもっと勉強しておけばよかったマーケティング・リサーチ〜その8〜

大学の時にもっと勉強しておけばよかったマーケティング・リサーチの7話目です。 セグメンテーション・コンセプト マーケティングにおけるセグメンテーションとは、商品やサービスを提供する集団を何らかの特徴をもとに集団を分割することです。つまり、特定…

大学の時にもっと勉強しておけばよかったマーケティング・リサーチ〜その7〜

大学の時にもっと勉強しておけばよかったマーケティング・リサーチの7話目です。毎度、更新するたびに、もっと勉強しておけばよかったと思います・・・。 市場反応分析 マーケティング戦略を考える場合、可能なのであれば予測または結果の分析をして、次回の…

大学の時にもっと勉強しておけばよかったマーケティング・リサーチ〜その6〜

大学の時にもっと勉強しておけばよかったマーケティング・リサーチの6話目です。仕事がバタバタしていたので、更新ができていませんでした。 さて、前回アナウンスした通り、これからは基本的にはデータの分析が中心的な話題となります。では市場構造分析か…

ggplot2のGrammar of Graphics

【ggplot2 Elegant graphics for data analysis備忘録】 何か調べたいことがあれば、ブラウザの「検索」機能を使って、「geom_xx」とか「コロプレスマップ」など入力して検索。 参照元:ggplot2 Elegant graphics for data analysis. by Hadley Wickham こち…

大学の時にもっと勉強しておけばよかったマーケティング・リサーチ〜その5〜

大学の時にもっと勉強しておけばよかったマーケティング・リサーチも5話になりました。これまでは、データを分析する前の段階の話が中心でしたが、今回からはデータの分析が中心的な話題となります。まず、マーケティング・リサーチで利用出来る変数をおさら…

大学の時にもっと勉強しておけばよかったマーケティング・リサーチ〜その4〜

前回はサンプリング調査設計方法について、おおまかにまとめましたが、今回は調査票の中身の部分について、書いています。調査票の質問項目なんて簡単では?と思っているあなた、それは調査票の深みをまだ知らないだけです。深みを知ってしまったら最後、ア…

大学の時にもっと勉強しておけばよかったマーケティング・リサーチ〜その3〜

大学の時にもっと勉強しておけばよかったマーケティング・リサーチも3話目に突入しました。前回はデータへの向き合い方について、大学院の時の講義資料などにもとまとめましたが、今回はデータを新しく取る必要が出てきた時に、意識するべきことをまとめてい…

大学の時にもっと勉強しておけばよかったマーケティング・リサーチ〜その2〜

今回は、マーケティング・リサーチの中で必要な「データ」および「データ分析」への向き合い方について書いていきます。データ分析の目的は「問題解決」ということであり、「手段が目的」となってはいけないということです。つまり、データを手に入れると、…

大学の時にもっと勉強しておけばよかったマーケティング・リサーチ〜その1〜

今回から、シリーズ「大学の時にもっと勉強しておけばよかったマーケティング・リサーチ」を書いていきます。これまでは、シリーズ「テキストマイニングはじめました」を書いておりましたが、一旦終了し、マーケティング・リサーチについて書いていきます。…

このブログはこちらに移動になりました。

このブログはこちらに移動になりました。 http://rtokei.tech/ 長い間ありがとうございました。 今後はこちらのサイトで記事の更新を行っていきます。 Twitterはじめました。 最新のポストはこちらのツイッターアカウントよりおしらせしますので、 ぜひフォ…

第80回 因子ベクトルのあれこれ

今回は「因子ベクトル」のあれこれを見ていきます。個人的には、なんかエラーが出ていると、原因は因子ベクトルにまつわるものでした…ということが多いので、因子ベクトルを再学習したものをまとめました。では行きましょう。 因子ベクトルとは!? CRANに載…

第79回 ggplot備忘録その9

今回は、ggplotのファセット(faset)を見ていきます。データを視覚化するときに、これでもいいんだけど、もう少し上手くグループでまとめられないか・・・という時に役立つオプションです。つまり、ファセットを使うことで、サブグループ毎に視覚化することが…

第79回 ggplot備忘録その9

今回は、ggplotのファセット(faset)を見ていきます。データを視覚化するときに、これでもいいんだけど、もう少し上手くグループでまとめられないか・・・という時に役立つオプションです。つまり、ファセットを使うことで、サブグループ毎に視覚化することが…

大学の時の備忘録〜社会心理学〜

以下は備忘録です。大学院の時に社会心理学を学んでおり、そのときの講義、参考書、文献のメモです。そのため、申し訳ありませんが、引用元の明記および引用範囲が明確ではありません。間違っている場合も多いにありえます。参考にされた方はご了承ください…

大学の時の備忘録〜社会心理学〜

以下は備忘録です。大学院の時に社会心理学を学んでおり、そのときの講義、参考書、文献のメモです。そのため、申し訳ありませんが、引用元の明記および引用範囲が明確ではありません。間違っている場合も多いにありえます。参考にされた方はご了承ください…

大学の時の備忘録〜社会学〜

以下は備忘録です。大学院の時に社会心理学を学んでおり、そのときの講義、参考書、文献のメモです。そのため、申し訳ありませんが、引用元の明記および引用範囲が明確ではありません。間違っている場合も多いにありえます。参考にされた方はご了承ください…

大学の時の備忘録〜社会学〜

以下は備忘録です。大学院の時に社会心理学を学んでおり、そのときの講義、参考書、文献のメモです。そのため、申し訳ありませんが、引用元の明記および引用範囲が明確ではありません。間違っている場合も多いにありえます。参考にされた方はご了承ください…

番外編〜行列の「行」って、「横」なの?「縦」なの?どっちなの?〜

今回は番外編です。番外編を書くきっかけは、Twitterを見てたらRowとColumnの方向を覚えたけど、すぐ忘れてどっちがどっちかわからない、というつぶやきを発見したので、まさに過去の自分のようで、、、、、そのような人たちのお力になれたらと思い急遽、番…

番外編〜行列の「行」って、「横」なの?「縦」なの?どっちなの?〜

今回は番外編です。番外編を書くきっかけは、Twitterを見てたらRowとColumnの方向を覚えたけど、すぐ忘れてどっちがどっちかわからない、というつぶやきを発見したので、まさに過去の自分のようで、、、、、そのような人たちのお力になれたらと思い急遽、番…

テキストマイニングはじめました〜その11〜

今回はとRを連携させて、テキストマイニングを実行していきます。Twitterはリアルタイムで「言葉」が集まってくるメディアなので、テキストマイニングを行えば、「今がわかる!!!!!」かもしれないですね。例えば、NHKの夜のニュース番組でも「つぶやきビ…

テキストマイニングはじめました〜その11〜

今回はTwitterとRを連携させて、テキストマイニングを実行していきます。Twitterはリアルタイムで「言葉」が集まってくるメディアなので、テキストマイニングを行えば、「今がわかる!!!!!」かもしれないですね。例えば、NHKの夜のニュース番組でも「つ…

テキストマイニングはじめました~その10~

今回はwordcloud関数の使い方をみていきます。wordcloud関数の説明は以下のページでもされているのですが、テキストマイニング初心者の私では、想像力が足りないため、出力された結果がどのような過程で出力されているのかわかりませんでした・・・ なので、…

テキストマイニングはじめました〜その9〜

今回はテキストマイニングとコレスポンデンス分析(対応分析)について見ていきます。目標は以下の通りです。 自由記述の回答を成形し、対応分析を行うこと 今回利用する自由記述のデータは、STAP細胞でおなじみの小保方先生著「あの日」のアマゾンのレビュ…

テキストマイニングはじめました〜その8〜

今回の目的は、以下の通りです。 テキストの長さを比較し、Brunner-Munzel Testで差を調べる 今回使用するデータは、石田先生著「テキストマイニング入門」からお借りしています。このデータもとは徳島大学の岸江先生の「日本語の配慮表現」に関する研究の際…

テキストマイニングはじめました〜その7〜

今回の目的は、最近?公開されたMeCabで使用する辞書「mecab-ipadic-neologd」をRMeCabで使うまでの道のりを書き記しました。なので、今回の目標は以下のとおりです。 Macで「mecab-ipadic-neologd」をRMeCabで使う 以下の公式ページを見ればなんとなくわか…

テキストマイニングはじめました〜その6〜

今回は共起関係を中心に学習していきます。この記事の目標は以下の通りです。 目標 collocate()関数、collScore()関数、T値、MI値の理解 また、今回使用するフォントは「国鉄方向幕書体」です。特徴は、懐かしさを思い出させる字体です。教科書とか、博物館…

テキストマイニングはじめました〜その5〜

今回はNgramを中心に学習していきます。そのため、この記事の目標は以下の通りです。 目標 Ngram()関数、NgramDF()関数、NgramDF2()関数、docNgram()関数、 Ngram2()関数を理解する また、今回使用するフォントは「はんなり明朝」です。特徴は、やさしくて、…

テキストマイニングはじめました〜その4〜

テキストマイニングのことを書き始めてはや4つ目です。今回の記事の目的は以下の通りです。 docMatrix()関数、docMatrix2()関数、docMatrixDF()関数、文書行列の重み付けの理解 気にしてないと思いますが、今回使用するフォントは「青柳衡山フォントT」です…

テキストマイニングはじめました〜その3〜

前回に引き続きテキストマイニングについて勉強していきます。今回の目標は以下のとおりです。 RMeCabC()関数、RMeCabText()関数、RMeCabFreq()関数、RMeCabDF()関数を理解する また、今回使用するフォントは「あおぞら明朝」です。 Rヘルプによれば、RMeCab…

テキストマイニングはじめました〜その2〜

今回から、さっそくRMeCab(R和布蕪)を使いながらテキストマイニングを学習していきます。MeCabというのは形態素解析をするためのツールです。名前の由来は、開発者の工藤さんがMeCab(和布蕪)が好物らしく、それに由来したと聞いております。また、RMeCab…

テキストマイニングはじめました〜その1〜

「冷やし中華はじめました」みたいな触れ込みたいですね。久々の更新です。今回からテキストマイニングに挑戦していきます。テキストマイニングは大学院の時もノータッチだったので、初歩の初歩から復習がてら書いていきます。正確には「初心者がテキストマ…

ベイズ統計学その20〜ベイズ推定を用いたt検定〜

□Bayesian Estimation Supersedes the t Test(BEST) 本日はベイズで平均値の差の検定を行っていきます。使用パッケージはBESTですが、JAGSもインストールしておく必要がありますので、ご注意ください。また、以下2本の論文と説明書を参考にしております。 ・…

第78回 ブートストラップ法

今回はブートストラップ法について見ていきましょう。ブートストラップ法はモンテカルロ法の一種で、標本から標本を再抽出することで、母集団の性質を推測する方法のことです。観測されたサンプルデータから母集団の性質を推測するとき、必ず誤差が生じてい…

第78回 ブートストラップ法

今回はブートストラップ法について見ていきましょう。ブートストラップ法はモンテカルロ法の一種で、標本から標本を再抽出することで、母集団の性質を推測する方法のことです。観測されたサンプルデータから母集団の性質を推測するとき、必ず誤差が生じてい…

第77回 当たりが出やすい宝くじ売り場!?

第77回は、たまにはブログも息抜きも必要ということで「当たりが出やすい宝くじ売り場!?」は存在するのか否かについて考えてみます。おそらく皆様の近所にも存在する「当たりが出やすい」と謳っている宝くじ売り場のことです。さてはて、本当なのでしょ…

第77回 当たりが出やすい宝くじ売り場!?

第77回は、たまにはブログも息抜きも必要ということで「当たりが出やすい宝くじ売り場!?」は存在するのか否かについて考えてみます。おそらく皆様の近所にも存在する「当たりが出やすい」と謳っている宝くじ売り場のことです。さてはて、本当なのでしょ…

第76回 重回帰分析と交互作用〜説明変数が2つ以上の時の作図〜

久しぶりの更新です。このブログのアクセス解析ページを見てみると、重回帰分析と交互作用のページへのアクセスが多いようなので、それに関連するトピックで記事を書いていきます。過去の関連記事は以下から参照ください。 第31回 回帰分析と重回帰分析 - …

第76回 重回帰分析と交互作用〜説明変数が2つ以上の時の作図〜

久しぶりの更新です。このブログのアクセス解析ページを見てみると、重回帰分析と交互作用のページへのアクセスが多いようなので、それに関連するトピックで記事を書いていきます。過去の関連記事は以下から参照ください。 第31回 回帰分析と重回帰分析 - …

第75回 ポリコリック相関係数・ポリシリアル相関係数

ポリコリック相関係数のp_11~p_00のp_00の式に誤りがありましたので、修正しました。(2016年2月21日) ポリコリック相関係数・ポリシリアル相関係数 カテゴリ変数の関係をみようとすると、これまではスピアマンの順位相関係数とかケンドールの順位相関係数…

第75回 ポリコリック相関係数・ポリシリアル相関係数

R

ポリコリック相関係数のp_11~p_00のp_00の式に誤りがありましたので、修正しました。(2016年2月21日) ポリコリック相関係数・ポリシリアル相関係数 カテゴリ変数の関係をみようとすると、これまではスピアマンの順位相関係数とかケンドールの順位相関係数…

ベイズ統計学その15〜線形回帰モデルとMCMC〜

今回はMCMCを使った線形回帰モデルをRで実践しながら見ていきます。その過程ででくわす基本的な用語も攫っていきます。 ベイズの線形回帰モデルを考える際には、未知パラメタβと誤差項のσ^2を求めることが目標になります。その際に、尤度関数をどう考えるか…

第74回 ポアソン分布とサッカーのゴール数

今回は、ポアソン分布とサッカーのゴール数の関係をもとに、基本的なポアソン分布の説明から、オフセットと過分散も検討したポアソン回帰までみていきます。 ポアソン分布 サッカーのゴール数がポアソン分布に従うことは有名な話ですね。そもそもポアソン分…

第74回 ポアソン分布とサッカーのゴール数

今回は、ポアソン分布とサッカーのゴール数の関係をもとに、基本的なポアソン分布の説明から、オフセットと過分散も検討したポアソン回帰までみていきます。 ポアソン分布 サッカーのゴール数がポアソン分布に従うことは有名な話ですね。そもそもポアソン分…

第73回 データの整形に関する備忘録

個人的には重要なのにすぐ忘れるので、データの整形に関する備忘録。 □データフレームの操作 □因子の順序を変更 sizes □データの大小に応じて因子の順序を変更 IS$spray □ファクタのレベル名を変更 sizes1 □カテゴリカル変数を別のカテゴリカル変数に変更 ol…

第73回 データの整形に関する備忘録

個人的には重要なのにすぐ忘れるので、データの整形に関する備忘録。 □データフレームの操作 □因子の順序を変更 > sizes <- factor(c("small", "large", "large", "small", "medium”)) > sizes.sml <- factor(sizes, levels = c("small", "medium", "large”)…

第72回 ggplot備忘録その8

今回はヒストグラムに関するggplotのコードを見ていきます。 基本的な設定ではビンの数が30になっているので、binwidthで調整することも忘れずに。また、同じデータでも、調整次第では全く違うように見させることも可能ですが、そうならないように注意する必…