Rを通じて統計学を学ぶ備忘録ブログ

SPSSからRに移行したい私のような人向けのR解説ブログ兼学習用備忘録。

http://users.stat.umn.edu/~helwig/notes/datamat-Notes.pdf <pre> d <- matrix(c(1,1,2,1,1,3,4,4,2,1, 3,2,3,2,2,4,1,4,3,2),10,2) d2 <- sweep(d, 2, apply(d, 2, mean), FUN = "-") d3 <- sweep(d2, 2, apply(d, 2, sd), FUN = "/")d4 <- as.matrix(d3/sqrt(</pre>…

ちょっとした備忘録のページ。

#確率密度関数=xをとる確率を返す #xの確率は? dnorm(0 ,0,1) [1] 0.3989423 #累積分布関数=xをとるまでの累積確率 #xの値を取るまでの累積確率は? pnorm(0) [1] 0.5 #分位点=下側確率がxとなるZの値が求まる #xの確率を取るときのZ値は? qnorm(0.0…

ggplot2のGrammar of Graphics

【ggplot2 Elegant graphics for data analysis備忘録】 何か調べたいことがあれば、ブラウザの「検索」機能を使って、「geom_xx」とか「コロプレスマップ」など入力して検索。 参照元:ggplot2 Elegant graphics for data analysis. by Hadley Wickham こち…

このブログはこちらに移動になりました。

このブログはこちらに移動になりました。 http://rtokei.tech/ 長い間ありがとうございました。 今後はこちらのサイトで記事の更新を行っていきます。 Twitterはじめました。 最新のポストはこちらのツイッターアカウントよりおしらせしますので、 ぜひフォ…

第80回 因子ベクトルのあれこれ

今回は「因子ベクトル」のあれこれを見ていきます。個人的には、なんかエラーが出ていると、原因は因子ベクトルにまつわるものでした…ということが多いので、因子ベクトルを再学習したものをまとめました。では行きましょう。 因子ベクトルとは!? CRANに載…

第79回 ggplot備忘録その9

今回は、ggplotのファセット(faset)を見ていきます。データを視覚化するときに、これでもいいんだけど、もう少し上手くグループでまとめられないか・・・という時に役立つオプションです。つまり、ファセットを使うことで、サブグループ毎に視覚化することが…

第79回 ggplot備忘録その9

今回は、ggplotのファセット(faset)を見ていきます。データを視覚化するときに、これでもいいんだけど、もう少し上手くグループでまとめられないか・・・という時に役立つオプションです。つまり、ファセットを使うことで、サブグループ毎に視覚化することが…

大学の時の備忘録〜社会心理学〜

以下は備忘録です。大学院の時に社会心理学を学んでおり、そのときの講義、参考書、文献のメモです。そのため、申し訳ありませんが、引用元の明記および引用範囲が明確ではありません。間違っている場合も多いにありえます。参考にされた方はご了承ください…

大学の時の備忘録〜社会心理学〜

以下は備忘録です。大学院の時に社会心理学を学んでおり、そのときの講義、参考書、文献のメモです。そのため、申し訳ありませんが、引用元の明記および引用範囲が明確ではありません。間違っている場合も多いにありえます。参考にされた方はご了承ください…

大学の時の備忘録〜社会学〜

以下は備忘録です。大学院の時に社会心理学を学んでおり、そのときの講義、参考書、文献のメモです。そのため、申し訳ありませんが、引用元の明記および引用範囲が明確ではありません。間違っている場合も多いにありえます。参考にされた方はご了承ください…

大学の時の備忘録〜社会学〜

以下は備忘録です。大学院の時に社会心理学を学んでおり、そのときの講義、参考書、文献のメモです。そのため、申し訳ありませんが、引用元の明記および引用範囲が明確ではありません。間違っている場合も多いにありえます。参考にされた方はご了承ください…

番外編〜行列の「行」って、「横」なの?「縦」なの?どっちなの?〜

今回は番外編です。番外編を書くきっかけは、Twitterを見てたらRowとColumnの方向を覚えたけど、すぐ忘れてどっちがどっちかわからない、というつぶやきを発見したので、まさに過去の自分のようで、、、、、そのような人たちのお力になれたらと思い急遽、番…

番外編〜行列の「行」って、「横」なの?「縦」なの?どっちなの?〜

今回は番外編です。番外編を書くきっかけは、Twitterを見てたらRowとColumnの方向を覚えたけど、すぐ忘れてどっちがどっちかわからない、というつぶやきを発見したので、まさに過去の自分のようで、、、、、そのような人たちのお力になれたらと思い急遽、番…

テキストマイニングはじめました〜その11〜

今回はとRを連携させて、テキストマイニングを実行していきます。Twitterはリアルタイムで「言葉」が集まってくるメディアなので、テキストマイニングを行えば、「今がわかる!!!!!」かもしれないですね。例えば、NHKの夜のニュース番組でも「つぶやきビ…

テキストマイニングはじめました〜その11〜

今回はTwitterとRを連携させて、テキストマイニングを実行していきます。Twitterはリアルタイムで「言葉」が集まってくるメディアなので、テキストマイニングを行えば、「今がわかる!!!!!」かもしれないですね。例えば、NHKの夜のニュース番組でも「つ…

テキストマイニングはじめました~その10~

今回はwordcloud関数の使い方をみていきます。wordcloud関数の説明は以下のページでもされているのですが、テキストマイニング初心者の私では、想像力が足りないため、出力された結果がどのような過程で出力されているのかわかりませんでした・・・ なので、…

テキストマイニングはじめました〜その9〜

今回はテキストマイニングとコレスポンデンス分析(対応分析)について見ていきます。目標は以下の通りです。 自由記述の回答を成形し、対応分析を行うこと 今回利用する自由記述のデータは、STAP細胞でおなじみの小保方先生著「あの日」のアマゾンのレビュ…

テキストマイニングはじめました〜その8〜

今回の目的は、以下の通りです。 テキストの長さを比較し、Brunner-Munzel Testで差を調べる 今回使用するデータは、石田先生著「テキストマイニング入門」からお借りしています。このデータもとは徳島大学の岸江先生の「日本語の配慮表現」に関する研究の際…

テキストマイニングはじめました〜その7〜

今回の目的は、最近?公開されたMeCabで使用する辞書「mecab-ipadic-neologd」をRMeCabで使うまでの道のりを書き記しました。なので、今回の目標は以下のとおりです。 Macで「mecab-ipadic-neologd」をRMeCabで使う 以下の公式ページを見ればなんとなくわか…

テキストマイニングはじめました〜その6〜

今回は共起関係を中心に学習していきます。この記事の目標は以下の通りです。 目標 collocate()関数、collScore()関数、T値、MI値の理解 また、今回使用するフォントは「国鉄方向幕書体」です。特徴は、懐かしさを思い出させる字体です。教科書とか、博物館…

テキストマイニングはじめました〜その5〜

今回はNgramを中心に学習していきます。そのため、この記事の目標は以下の通りです。 目標 Ngram()関数、NgramDF()関数、NgramDF2()関数、docNgram()関数、 Ngram2()関数を理解する また、今回使用するフォントは「はんなり明朝」です。特徴は、やさしくて、…

テキストマイニングはじめました〜その4〜

テキストマイニングのことを書き始めてはや4つ目です。今回の記事の目的は以下の通りです。 docMatrix()関数、docMatrix2()関数、docMatrixDF()関数、文書行列の重み付けの理解 気にしてないと思いますが、今回使用するフォントは「青柳衡山フォントT」です…

テキストマイニングはじめました〜その3〜

前回に引き続きテキストマイニングについて勉強していきます。今回の目標は以下のとおりです。 RMeCabC()関数、RMeCabText()関数、RMeCabFreq()関数、RMeCabDF()関数を理解する また、今回使用するフォントは「あおぞら明朝」です。 Rヘルプによれば、RMeCab…

テキストマイニングはじめました〜その2〜

今回から、さっそくRMeCab(R和布蕪)を使いながらテキストマイニングを学習していきます。MeCabというのは形態素解析をするためのツールです。名前の由来は、開発者の工藤さんがMeCab(和布蕪)が好物らしく、それに由来したと聞いております。また、RMeCab…

テキストマイニングはじめました〜その1〜

「冷やし中華はじめました」みたいな触れ込みたいですね。久々の更新です。今回からテキストマイニングに挑戦していきます。テキストマイニングは大学院の時もノータッチだったので、初歩の初歩から復習がてら書いていきます。正確には「初心者がテキストマ…

ベイズ統計学その20〜ベイズ推定を用いたt検定〜

□Bayesian Estimation Supersedes the t Test(BEST) 本日はベイズで平均値の差の検定を行っていきます。使用パッケージはBESTですが、JAGSもインストールしておく必要がありますので、ご注意ください。また、以下2本の論文と説明書を参考にしております。 ・…

第78回 ブートストラップ法

今回はブートストラップ法について見ていきましょう。ブートストラップ法はモンテカルロ法の一種で、標本から標本を再抽出することで、母集団の性質を推測する方法のことです。観測されたサンプルデータから母集団の性質を推測するとき、必ず誤差が生じてい…

第78回 ブートストラップ法

今回はブートストラップ法について見ていきましょう。ブートストラップ法はモンテカルロ法の一種で、標本から標本を再抽出することで、母集団の性質を推測する方法のことです。観測されたサンプルデータから母集団の性質を推測するとき、必ず誤差が生じてい…

第77回 当たりが出やすい宝くじ売り場!?

第77回は、たまにはブログも息抜きも必要ということで「当たりが出やすい宝くじ売り場!?」は存在するのか否かについて考えてみます。おそらく皆様の近所にも存在する「当たりが出やすい」と謳っている宝くじ売り場のことです。さてはて、本当なのでしょ…

第77回 当たりが出やすい宝くじ売り場!?

第77回は、たまにはブログも息抜きも必要ということで「当たりが出やすい宝くじ売り場!?」は存在するのか否かについて考えてみます。おそらく皆様の近所にも存在する「当たりが出やすい」と謳っている宝くじ売り場のことです。さてはて、本当なのでしょ…