無知蒙昧なセンテンス

その辺の社会人が色々なものの言語化を試みる場です。

統計独学の道のり6

あけましておめでとうございます、さみっとです。
今年は大学院なる場所に所属することになるので、より一層身を引きしめて行きたい......とはそんなに思ってないです()
自分が楽しいと思えることをなるべく沢山やっていきたいですね。


新年の抱負を長々語る気は無いのでここら辺で話題を移行します。

1年ほど前に購入し牛歩のようなペースで読んでいた『自然科学の統計学をついに読み終わったので、その感想や所感を書きたいと思います。
この本は東京大学出版会が刊行する『基礎統計学シリーズのひとつで、このシリーズはⅠ『統計学入門』(赤い本)、Ⅱ『人文・社会科学の統計学』(緑の本)、そしてⅢ『自然科学の統計学』(青い本)からなっています。Ⅰは基礎的な統計学の内容で、Ⅱ、Ⅲは各分野で使われる統計的な手法や考え方を扱っています。
今回読んだ『自然科学の統計学』は、主に自然科学、工学、医学などの分野で使われている統計的な手法を広く解説しており、執筆者も章ごとに異なっています。また、基礎的な統計・確率の知識は前提とされているので、何らかの入門書を読んでいることが推奨されていると思われます。

とまあここまでは本の受け売りなんですけど()、初学者向けではないと書かれているだけあって内容はかなり難しかったです…実際、全部を理解出来たわけではなく、一部理解を諦めた部分もあります。各章に章末問題がついているのですが時間や気力の都合で大部分の問題をやれなかったので、これらの問題をしっかり解けばもう少し理解が深まるのかなぁと思ってます。以下、各章ごとに軽く感想を書いていきます〜

・第1章 確率の基礎
各種確率分布の性質やモーメント母関数、中心極限定理について書かれている章。章末問題を解いたこともあり、割と理解出来たと思います。章末問題はどれもかなり難しく、1問1時間以上かかるものもありました。

・第2章 線形モデルと最小二乗法
回帰分析の予測式の導出、正規方程式や、予測式の係数の分散、誤差分散、線形仮説と言った内容が書かれている章。非心分布の概念が理解できませんでたが、この章も章末問題を解いたので、それ以外は大体理解できた気がします。

・第3章 実験データの分析
分散分析の話。この章は大学の講義でほぼ同じ内容を学んでいたこともあり、サラッと読むだけで終わりました。

・第4章 最尤法
最尤推定法や、フィッシャー情報量、推定量の漸近分布といった話。こちらも章末問題を解いたので、割と理解出来たと思います。

・第5章 適合度検定
分割表とかクロス集計表のカイ二乗検定の章。基本的なことは元々知っていましたが、この章で扱っていたカイ二乗統計量の分解やブラッドリーテリーのモデルといった内容については理解不十分といった感覚が残りました。

・第6章 検定と標本の大きさ
検出力の話。様々な検定での検出力関数やネイマン・ピアソンの補題を扱っています。ネイマン・ピアソンの補題は未だにしっくり来ないですね。

・第7章 分布の仮定
正規分布より裾の長い分布において、より良い推定量や検定の検出力がより大きくなる統計量を考えるといった話。章末問題を解いていないですが、ストーリーの大枠は掴めたと思います。

・第8章 質的データの統計的分析
主にロジットモデルとプロビットモデルでの分析の話です。二値データの分析の際、その二値のどちらを取るかを決定する仮想的な因子を考えることでモデル化している事が分かったのは良かったです。

・第9章 ベイズ決定
ベイズの定理やベイズ推定の理論、統計的決定理論といった内容。損失関数や統計的決定理論といった概念の一般的な話が難しく、理解不十分な感じがしてます。

・第10章 確率過程の基礎
ランダム・ウォーク、マルコフ連鎖ブラウン運動ポアソン過程といった内容。全体的にふわっとしか掴めておらず、式操作の細かい部分は理解しきれてない印象です。特に、後半の応用部分で出てきた様々な確率過程(フェラー・アレイ過程、ケンドール過程、ユール過程などなど)はよく分かってないです。

・第11章 乱数の性質
一様乱数の発生法、及びそれを利用した他の確率分布に従う乱数の発生法が書かれています。別名法と多次元疎結晶構造のスペクトル検定の部分が分かってないです。


こうして振り返ると、後半の章の方が理解できてない部分が多い感じですね。わかってない部分を理解するなら章末問題をじっくり解いて考えるか、必要に応じて他の書籍やネットを使って補完していく必要がありそうです。
まあそこまでやるつもりは今のところあんまりないんですけどねw

では。