無知蒙昧なセンテンス

その辺の社会人が色々なものの言語化を試みる場です。

統計独学の道のり4

こんにちは、さみっとです。

先日、統計独学の指標にしてきた統計検定準1級を受験したのですが、無事合格しました!!しかもS評価での合格でちょっとびっくりしてます(゚Д゚;)

 

というわけで今回は、準1級を受けるにあたって勉強した内容や試験本番のことを備忘録としてまとめたいと思います。一応今までの記事を貼っておきますが、過去記事とあんまり関連性はないと思います。

 

mutimoumai.hatenablog.com

mutimoumai.hatenablog.com

mutimoumai.hatenablog.com

mutimoumai.hatenablog.com

 

1.試験の2か月前までの時期

ちゃんと勉強し始めたのは去年の4月で、そこから今年の3月くらいの一年間でやった内容を書いていきます。基本的に統計の本を買って熟読をする、以外のことはしてないです(ちょっとだけネットの記事を読んだりもしましたが、内容がほとんどわからず意味がなかったので割愛)。

 

1-1.『入門統計解析』

 

入門統計解析

入門統計解析

 

 最初に読んだ本で、平均値や分散から、基本的な確率分布、統計的仮説検定の概念、回帰分析や分散分析といったところまで、統計の基礎的な内容をざっと学べます。読んだ書籍の中ではぶっちゃけこれが一番優先度が高いと思います。この内容をしっかりと理解しとけば2級はほぼほぼ合格できそうです。ですが、準1級の合格はこれだけでは厳しいといった感じです。ただ応用的な内容を学ぶ時もこれを読んでると理解しやすくなるので、かなり重要だと思いました。

東京大学出版の『統計学入門(基礎統計学Ⅰ)』と内容が似通っておりこっちの方が人気があるイメージですが、好みの問題だと思います。

 

統計学入門 (基礎統計学?)

統計学入門 (基礎統計学?)

 

 

1-2.『意味が分かる多変量解析』

 

まずはこの一冊から意味がわかる多変量解析 (BERET SCIENCE)

まずはこの一冊から意味がわかる多変量解析 (BERET SCIENCE)

 

 『入門統計解析』でほとんど触れられてなかった多変量解析の本。相関係数・相関比、回帰分析、判別分析、主成分分析、因子分析、数量化手法あたりの基礎を学べます。内容は数式が多めでスラスラとは読みにくいですが、丁寧で良かったです。ただ、準1級の膨大な範囲を考えると本を買ってまで多変量解析を学ぶ必要性は低いかもしれないです。あと、欲を言えばクラスター分析にも触れてほしかったですね。

 

1-3.『史上最強図解 これならわかる!ベイズ統計学

 

史上最強図解 これならわかる!ベイズ統計学

史上最強図解 これならわかる!ベイズ統計学

 

 こちらも『入門統計解析』で触れられてない分野であるベイズ統計に関する基礎的な本。とにかく分かりやすく、数式がある本にしてはかなり短期間で読めます。ベイズの定理に至るまでの過程を丁寧に説明してるので読みやすいです。準1級でもベイズ関係の問題は出やすいイメージがあるので試験という観点でも買う価値はあると思います。

 

1-4.『自然科学の統計学

 

自然科学の統計学 (基礎統計学)

自然科学の統計学 (基礎統計学)

 

 『入門統計解析』の内容を数学的に深めつつ、範囲も広げたような本。全11章からなり、各章は比較的独立しているのでやりたいところからやれます。というか通読しようってテンションでやると重過ぎて詰みかねないので、やりたい章を選択してやったほうがいいと思います。自分は時間とモチベが足りなかったので、第1章「確率の基礎」と第2章「線形モデルと最小二乗法」だけやりました。歯ごたえ満載で1章分やるのにもすごく時間がかかったのですが、やった章の内容に関してはかなり力が付いたと思います。特に章末の練習問題は準1級の記述問題よりも難しいので、これを解いておくのは強みになると思います。

 

1-5.分散分析に関するレジュメ

大学の講義で配られてたレジュメなので参考にはならないと思いますが、とても分かりやすかったので分散分析はほとんどこのレジュメで勉強しました。内容は一元配置、二元配置、フィッシャーの三原則、ブロック化、乱塊法、直行表の見方、あたりです。

 

2.試験直前期(約2カ月間)

直前期とそれ以前の期の分け方ですが、2か月くらい前に準1級の試験範囲をしっかりと確認し、その範囲を網羅するような勉強に切り替えたことを基準にしてます。上記の期間は統計を知るための勉強でしたが、こっちは統計検定に受かるための勉強、といった感じです。

試験範囲を確認した時に「え!?範囲広すぎやろw」と思ったのですが、とりあえず現段階でどれくらい解けるのかを試すべく、公式HPの例題集を解きました(形式は本番と同じだったので本番同様の時間で解きました)。結果半分弱しか解けず、HPに書かれていた合格基準が6割程度だったのでこりゃまずいと思い範囲を網羅するべく勉強しました。

例題集を解いたときに、範囲は広いけど多くが記号選択式で、また論述問題については3題中1題選択ということである程度範囲を絞れると感じたので、基本的には浅く広く勉強しました。

 

2-1.『自然科学の統計学』続き

といってもほとんどやってませんw第10章「確率過程の基礎」の部分を一読したのですが、章末の練習問題を解かないと全然理解できなさそうだったのと、問題を解くほどの時間がなかったという理由で、あんまり意味はなかったです(実際本番でも確率過程は出なかったので、結果論的にも意味はなかったです)

 

2-2.インターネット

マジでこれに尽きます。インターネット様様です。特に今回みたいに広い範囲を網羅的に理解するときはめちゃくちゃ役に立ちました。今まで読んできた本に載ってない内容は全部ネットで調べてわかりやすいブログやウェブサイトを見て、その内容をルーズリーフに軽くまとめて...という作業を繰り返しました。最初は例題集の解説を読んでもわからない部分を調べ、その後は準1級の範囲表に載ってるキーワードでわからないものを片っ端から調べて、全キーワードについてざっと意味とやってることを理解するようにしました。この作業を平均して毎日1~2時間やって、だいたい1か月ちょいで全キーワードを調べ終わりました。調べてわからなかったものもいくつかありましたが、試験問題の多くが記号選択式であることを考慮して深入りはしすぎないようにしました。これでかなり解ける問題が増えたと思います。

 

2-3.過去問と総仕上げ

最後の2週間で過去問を解きました。といっても過去問が2016年と2017年の2回分しかなかったので(しかも2016年は今とは多少形式が異なる)、2回解いてわからなかった問題は解説を読んだりネットで調べたりしてしっかりと理解するようにしました。過去問のやり方としては本番同様に時間を計って問題を解き、その後時間内で解き切らなかった問題を全て解く、といった流れでやりました。また、1題を選択する論述問題は制限時間内で1題だけ取り組み、制限時間外で残り2題を解くようにしました(例題集も同様です)。

まず2016年度の過去問を解いたのですが、この時は時間感覚がよくわからず約20分足りないレベルで時間切れになってしまったので、手ごたえとしては厳しめでした。ただ時間が足りてたら合格できそうだったので時間配分に気を付けるようにしました。

次に2017年度の過去問を解いたところ、気を付けてても多少時間が足りなかったのですが手ごたえとしては合格基準を上回ってそうな感じでした。

一通り過去問を解いたら、最後は例題集と過去問の中でもう一度解いておきたい問題を解きなおしたり自分でまとめたルーズリーフを見直したりして本番に臨みました。

 

3.試験当日と所感

まず、時間はかなり意識して解いたのでギリギリで解き切ることができました。

問題傾向は過去問とはかなり変わり、初出の分野が多かったのでネットで仕入れた知識がかなり役に立ちました。また、論述問題はもともとは『自然科学の統計学』で解いていた確率か回帰分析の問題を解くつもりでしたが、今年はなぜかどちらのテーマの問題もなかったので分散分析の問題を選択しました。論述に関してはだいたい解けたと思います。

手ごたえとして受かった感じはありましたが、部分記述と記号問題をちょいちょい落としてたのでギリギリだろうなと思ってました。また落とした問題の中には結構ケアレスミスが多く、勉強量・演習量の足りなさがうかがえました...wなので結果がS評価なのが本当に予想外でびっくりしてます。

ただ今年は時系列分析の問題が多くそこで何問か落としたので、多変量解析の本よりこの分野の本を読んでおいたほうがよかったのかもしれません(結果論ですが)。

まあなにはともあれ、合格できてよかったです!

.

.

.

今後についてですが、いけそうなら今年中に1級を受けてみたいと思います。また準1級の対策をしているときにモデリング関係が特に難しく感じたので、時間があれば『データ解析のための統計モデリング入門』にも触れたいですね。そのほかにもいくつか気になる本があるのですが、その辺は気分次第で読みたいです。まあ、何をするかは気分と忙しさで決まりますw

 

 

以上です。では~