無知蒙昧なセンテンス

その辺の社会人が色々なものの言語化を試みる場です。

統計独学の道のり5

どうも、さみっとです。

 

mutimoumai.hatenablog.com

 前回の記事(↑)では統計検定準1級を受けた時の話をしたのですが、この記事の最後に「できれば今年中に統計検定1級を受けたいな~」みたいなことを言ったんですよね。

 

先日受けてきました、はい。

 

準1級受けた直後はそんなにモチベなかったんですけど、だんだんモヤモヤしてきて「どうせやるなら一番上の級まで取りたい」っていう気持ちが強まったんで1級を受験しました。今は結果待ちです。

 

追記︰不合格でしたorz なので対策法とかは参考にしない方がいいと思われます…

 

追記2:この一年後(2019年)にリベンジして合格しました!その時の記事をここに貼っておきますので、こちらも見て頂けると幸いですm(_ _)m

 

mutimoumai.hatenablog.com

 

 

 

というわけで今回は統計検定1級を受けるにあたって自分がやったことや、準1級との違い、ついでにそれぞれの対策法なんかを書いていこうかなと思います。

 

~~~~~~~~~~~~~~~~~~~~~~~~

 

 1.統計検定1級について

準1級までは試験科目が1つでそれだけで合否が決まるのですが、1級は「統計数理」と「統計応用」の2科目あって両方に合格しないと1級の資格をもらえないシステムになってます。片方だけ合格基準に達しても1級は取れないわけですね。

この統計数理と統計応用はそれぞれ90分の筆記試験で、試験当日は午前に統計数理、午後に統計応用を受けました。問題形式はどちらも同じで、全て記述形式の問題で5問ある大問の中から3問を選択して解く、という形式です。それぞれの大問は3~5問程度の小問から成り立っています。全部記述なのでなかなかハードでした…

また、統計応用は申込み時に「人文科学」、「社会科学」、「理工学」、「医薬生物学」の中から一つを選択する必要があり、この分野ごとに解く問題が5問ずつ用意されています。自分は理工学分野を選択しました。なのでこの記事内での統計応用は理工学分野の話です(分野が違うと問題が違うので参考になりません)。

合格基準は一応公式サイトには6割と書いてあるのですが、すべて記述式で配点が一切公表されていないため、あくまでも目安といった感じだと思います。(個人的には、3つの大問のうち2つをきちんと解ければ合格基準に達するような気がしてます)

 

2.本番までにやったこと

今年の6月の準1級を受けるまでにやったことは最初に貼った前回の記事にまとめてあるので、そこから11月25日の1級の試験日までにやったことを書いていきたいと思います。

2-1.『自然科学の統計学

 

自然科学の統計学 (基礎統計学)

自然科学の統計学 (基礎統計学)

 

書籍の中ではこれを一番やりました(といっても書籍は2つしかやってないですが...)

やった章は、

●1章「確率の基礎」

●2章「線形モデルと最小二乗法」

◎4章「最尤法」

△5章「適合度検定」

△6章「検定と標本の大きさ」

△7章「分布の仮定」

 

で、このうち●は章末問題だけ行い、◎は内容理解と章末問題の両方やり、△は内容理解のみ行いました。1級の問題内容だけに焦点を当てるなら1章と4章以外は直接関係はない気がしますが、どの章もボリュームたっぷりなので統計学を学ぶという意味ではとても良いと思います。逆に1章と4章はかなり有効な1級対策になったので、しっかりやって良かったです。

 

2-2.『データ解析のための統計モデリング入門』 

 さっと通読しました。結果としては1級の対策というより統計の知識を補充するという意味合いが強かったです。評判の高い本だけあって内容はわかりやすく、モデリングの基礎を理解するのにうってつけだと思います。ただ、マルコフ連鎖の説明があまりなかったり、モデリングの内容も厳密な部分にはあまり触れられてなかったりしたのであくまでも入門というスタンスなんだと思います。

 

2-3.主要な確率分布の期待値・分散・モーメント母関数の導出練習

qiita.com

↑の記事で確率分布に習熟することが重要と書いてあったので、1級の範囲表に書いてある確率分布(ロジスティック分布は諦めました…)についての期待値、分散、(一部の確率分布には存在しませんが)モーメント母関数、を確率密度関数から導出するという作業をやりました。これは実際めちゃくちゃ役に立ったと思います。後述しますが、1級の問題はほぼ確率分布から出ると言えるので、確率分布絡みの計算練習はかなりいい練習になりました。この見出し通り、ひたすら確率分布の期待値と分散とモーメント母関数を手を動かして計算するだけですw分からないときはネットで調べて対処してました。

 

2-4.過去問

 

日本統計学会公式認定 統計検定 1級・準1級 公式問題集[2016〜2017年]

 

 

これは公式から販売されている過去問集を買ってやりました。この本には2016年と2017年の過去問が収録されており、まず本番の2ヶ月前くらいに2016年度を時間無制限で調べながら解き、その時に知らなかったことを理解して、本番の2週間前くらいに2017年度を時間を計って解きました。具体的には、統計数理、統計応用共にまずは時間を計って3問を解き、その後残りの問題も解いてみる、という形式でやりました。

2016,2017年度共に出題範囲が似通っており、今年(2018年度)の問題も似たような範囲・形式だったので、過去問はかなり有効な対策になったと思います。

2年分の問題を一通り解いたあと、本番の直前に難しかった問題をもう一度解いて確認しました。

 

 

今挙げたこと以外にも対策として他のことを若干したのですが、あまり役に立たなかったので割愛します。

 

3.当日の所感

過去問をやった時の感覚として、基本的に時間内に3問完答はできなさそうというのと、問題によって結構難易度に差があって選ぶ問題が重要になってくるというのがあったので、この辺を念頭に置いて解きました。(といっても正直解きやすい問題かどうかは解いてみないとわからなかったので、問題の選び方は実質運任せでした…)

統計数理はとりあえず2問をだいたい解き切り(少しできない部分もあったが、大体の小問には解答できたつもり)、3問目の途中まで解いたところで時間切れ、でした。手ごたえ的には悪くなかったです。

統計応用は結構苦戦しました。。1問をだいたい解き、もう1問は半分くらい、最後の1問は半分弱、といった感じでした。配点次第では全然落ちるような手ごたえでした。

 

4.準1級との違い

一般に資格と聞くと、級が小さくなるほど試験範囲が広くなって問題も難しくなる、というイメージを思い浮かべがちだと思います。実際、統計検定も準1級まではそうだと思いますが、準1級と1級は違います。HPに書いてある範囲表を見る分には1級の方が広そうにも見えますが、問題の傾向から考えると1級は準1級よりもはるかに範囲が狭いと思われます。どちらも受けた身からすると、覚える量は準1級の方が全然多かったです。

範囲が狭かったら1級の方が簡単なの?と思うかもしれませんが、そういうわけでもありません。1級は上でも言ったようにすべて記述式ですが、準1級は全体の半分強が記号選択、1割くらいが部分記述(数値を答えたり1~2行で記述したりといった形式です)。つまり、準1級は浅く広く学ぶ必要があり、一方で1級は狭く深く学ぶ必要があります。体感では、準1級は割とHPに書いてある範囲を一通り知っておく必要があるが1級は範囲の一部についてしっかりと理解して使いこなせる必要がある、といった感じです。

 

5.独断と偏見による1級の対策法

1級は実質的な範囲がかなり狭くなっているので、その部分だけを集中的に勉強するのが良いと思います。ただこれは合格することだけを考えた行動で、統計学の素養を深めるという意味合いではあまりおすすめは出来ないことを断っておきます。

それで実質的な範囲についてですが、ズバリ確率分布と最尤推定法です。あとは期待値や分散の計算に慣れることです。この辺りを抑えれば合格出来るんじゃないかなと思います。基本的にはこの辺りの計算練習や問題演習を重ねるのが1番無難だと思います。注意したいのは、これは統計応用で「理工学分野」を選択した場合の話です。他の分野で受験する場合は異なってきます。理工学分野の問題はほとんど統計数理の問題と同じ範囲なので、実質1科目のような感覚で対策できます。

確率分布については、上でも述べたような確率密度関数から期待値や分散、モーメント母関数を導出するのが良いと思います。導出する上で必要な知識は高校の理系数学レベルの知識+‪α、と言った感じですかね。部分積分や置換積分はめちゃくちゃ使うのである程度慣れてないと苦しいです。+‪αの知識としては、マクローリン展開、ガンマ関数、ガウス積分、二項定理あたりが必要になってきます。他には2変量正規分布の条件付き確率の導出とかもしておくといいでしょう。

最尤推定法は、原理を理解すれば割とワンパターンなのでそこまで辛くはないですが、必須の知識です。計算としては偏微分を使うので、抑えた方がいいでしょう。

あとは期待値や分散の計算、と書いたのですが、これは期待値や分散の性質を抑えてスムーズに計算出来るようにしておくというニュアンスです。期待値の線形性とか分散と期待値の関係とかをしっかり身につけておくのがめっちゃ重要だと思います。この辺りの処理が早いと時間内に3問解ききれる可能性が高くなるので、できるだけ練習した方が良いです。

この他にも確率変数の変数変換とかもよく出るイメージなので出来るようにした方がいいと思います。

上記のことがかなりスムーズにこなせるようになったら、範囲表に載ってる他の部分の勉強をすると盤石になるんじゃないかと思います(自分はその時間がなかったのでほとんどやれませんでしたが…)

 

こんな感じですかね。統計検定は公式の教科書の癖がやや強い()こともあり対策を自分で考える必要があるので、少しでも参考になれば幸いです。

 

参考:対策としてよく使っていたサイト

以下に、自分が1級の対策をするときによく使っていたサイトを紹介します。

www.data-arts.jp

1級と準1級の過去問(2018年12月の時点でどちらも4年分掲載)や試験範囲の知識がまとまっています。知識は数理的な部分がメインでかなり網羅的なので、1級を目指す場合は非常に役立つと思います。過去問も豊富なのでこのサイトを知っておいて損はないでしょう(ただし統計応用が理工学分野のみなので注意が必要です)。

ただ、過去問の解説や知識の説明が数式ばかりで日本語の説明が少なく、不必要な知識もあるのでこれをメインにして対策するのは大変かもしれません。

 

data-science.gr.jp

1級に必要な知識とかなりリンクした範囲の解説が載っており、上のData Artsよりも説明が分かりやすいです。1級に役立つのは理論関連事項の「統計学の基本事項」と「確率分布」のページです。最尤推定法とかは載ってないので別のところで勉強する必要があります。

 

mathtrain.jp

かなり有名(?)なサイト。説明が丁寧なので数学的な事項を補充するのに役立ちます。

 

starpentagon.net

こちらは統計検定1級に合格した方のブログで、1級の対策ページや過去問の解説、受験記が載っています。自分は過去問の解説を見る時に参考にしました。過去問の解説は上に載せたData Artsよりも分かりやすくて詳しいので参考になりますが、一部の問題しかないので公式の過去問集やData Artsなどとうまく組み合わせて使うといいと思います(このサイトも統計応用は理工学分野のみなので注意です)。

 

他にも有用なサイトはあると思いますが、自分がよく使っていたのはこの辺ですね。

 

~~~~~~~~~~~~~~~~~~~~~~~~

 

今後についてですが、統計に関しては『自然科学の統計学』を読み進めたいと思っています。

また、1級の勉強をしている中で確率という概念をもう少し掘り下げたいと思ったので、測度論的確率論とかも勉強してみたいなと言う気持ちがあります。他にも統計の知識を活かすためにプログラミングや機械学習といった方面にも手を出せたらと思います。まあ、何をやるは気分で決めます(笑)

 

 

以上です、ではでは~