StatModeling Memorandum

StatModeling Memorandum

StanとRとPythonでベイズ統計モデリングします. たまに書評.

統計・R・Stan関連の本、用途別のオススメ10冊

年末年始向けに、比較的読みやすい本を中心にオススメします。

統計学入門

色々読んでみましたが、現在決定版と言えるものは存在しないように思えました。個人的には、シグマと積分の復習、場合の数・数え上げの方法、確率、確率変数、確率密度、度数分布とヒストグラム、代表値・平均・分散、確率分布、同時分布、周辺分布、確率変数の変数変換、検定、散布図と箱ひげ図、回帰、相関あたりをRなどを使いながらシンプルに説明していく本があるといいと思うのですが、なかなかバランスのとれたいい本がありません。初歩の初歩しか説明してない、グラフが少ない、検定にページを割きすぎ、分厚い、ちょっと難しいなどの不満点があります。立ち読みして自分にあった本を選ぶのがいいと思います。ネットで検索して調べるのでもいいと思います。

統計学演習

統計の実力向上のためには、「紙と鉛筆で手を動かして計算する」という経験がどこかで必要になります。そこで、シグマと積分はすでに慣れ親しんで、統計の初歩は少し知っている人に以下の演習書をオススメします。

統計学演習

統計学演習

演習問題の難易度と内容が素晴らしいです。しかし、演習の前にある簡潔なまとめは説明がないので、復習として使うのがよいでしょう。

統計や検定を少し知っている人がRをはじめたい

「Rで楽しむ統計」がオススメです。例題がすごくいいです。また、重要であるのにもかかわらず一般的な本では説明を飛ばしているようなトピックを扱っていて勉強になります。

Rで楽しむ統計 (Wonderful R 1)

Rで楽しむ統計 (Wonderful R 1)

統計や検定を少し知っている人が統計モデリングをはじめたい

「データ解析のための統計モデリング入門」がオススメです。検定を乱用している人はぜひ読んでほしいです(乱用している自覚がある人は乱用しないかもですが)。

プログラミング少しできる人が統計モデリングをはじめたい

我田引水ですが「StanとRでベイズ統計モデリング」がオススメです。詳しくはこちらの記事を参照してください。

StanとRでベイズ統計モデリング (Wonderful R)

StanとRでベイズ統計モデリング (Wonderful R)

Stanにもっと詳しくなりたい

Stanのマニュアルがオススメです。主要パートについては日本語訳もほとんど完成しており、以下のプロジェクトのReleasesタブに200ページ弱のpdfがあります。 github.com もともとの英語が難しく、訳に苦戦している箇所もあるので、プルリクエストお待ちしております。

因果推論や効果測定を詳しく知りたい

「岩波データサイエンス vol.3」がオススメです。統計を扱う上で非常に重要なのが因果関係ですが、この本を除いて読みやすい類書がほとんどありません。傾向スコアだけでなく、反実仮想を考えた回帰モデルやRCT(ランダム化比較試験)との対応がきちんと書いてあって勉強になりました。

岩波データサイエンス Vol.3

岩波データサイエンス Vol.3

解析で利用する立場からRをバランスよく詳しくなりたい

「改訂3版 R言語逆引きハンドブック」がオススメです。基本グラフィックスやファイル操作も詳しいです。見開きで読みやすいです。

改訂3版 R言語逆引きハンドブック

改訂3版 R言語逆引きハンドブック

統計に興味はないけど、プログラミング言語としてのRを知りたい

R言語徹底解説」がオススメです。エンジニア向けと思います。可視化などはあまり載っていません。

R言語徹底解説

R言語徹底解説

Rのデータ処理に詳しくなりたい

Rといえばデータ処理能力と作図能力がずば抜けています。データ処理については今のところ「Rデータ自由自在」がオススメです。

Rデータ自由自在

Rデータ自由自在

しかし、内容が少し古くなってきた感じがあります。現在は{dplyr}{tidyr}などのパッケージを使ってデータ処理するのが主流になりつつあります。2017年にWonderful Rのシリーズとして良い本が出るようなので待ちましょう。

Rの可視化(ggplot2)を使ってみたい

今のところ「Rグラフィックスクックブック」がオススメです。カラーページが多くびびります。

Rグラフィックスクックブック ―ggplot2によるグラフ作成のレシピ集

Rグラフィックスクックブック ―ggplot2によるグラフ作成のレシピ集