無知蒙昧なセンテンス

その辺の社会人が色々なものの言語化を試みる場です。

機械学習初心者がはじパタを読みました

こんにちは、さみっとです。

改元は人生で2、3回ぐらいしか経験しないことだと思うとすごいレアなことだとは思うんですが、元号が変わっても自分を取り巻く環境は変わらないし日常は変わらず続いていくので、”ただレアなだけ”のイベントって感じですね。といっても、テレビを見ててもSNSを見てても非日常感があまりにすごいので結構ソワソワしてきてます(草)←今初めて使ったんですけど(草)って表現シュールでいいですね。
令和、良い時代になっていくといいですね。

今年に入ってから機械学習について少し学んでおきたいと思いおすすめの書籍を調べてみたところ、初心者にはややハードルが高いといった情報もありましたが評価が高かったので『はじめてのパターン認識(平井有三)という本を1月に購入して読み始め、ギリギリ平成が終わるまでに読破できました。

機械学習についてほとんど知らない状態でこの本を読んだのですが、確かに機械学習関連の事前知識がいらないという意味では「はじめての」というタイトル通りだなあと思いました。ですが個人的な感想としては決してスラスラと読める類のものではなく、内容をしっかりと咀嚼しながら進めていく必要のある本でした。というのも、そこそこ数式が出てくるので数式を追う必要があるからです。基本的には移動時間などの隙間時間で読み進めましたが、それだけだとわからない部分が出てきたのでちょいちょい紙とペンを用意して数式をかみ砕いて進めていきました。微積線形代数統計学の基礎的な知識がないとなかなか苦労すると思います。自分の場合、特に線形代数の部分で躓きました。躓いたときはネットで調べたりしてなるべく数式の意味を理解しながら読み進めたのですが、数式の細かい部分で時間をかけていると全体的な理解が怪しくなっていくような感覚がありました。章末問題は本文の数式に比べて分かりやすい設定の問題が多く、理解の助けになりましたね(全体的に問題文が雑な印象はありましたが…)。読後感としては点では理解していてもそれが線でつながって理解した感覚はなく、、、といった感じで、もう一度読み直すとスッキリしてくるのかもしれません。

内容は全11章からなり、1章と2章でパターン認識機械学習の俯瞰を行い、3,4章でベイズの識別規則や正規分布のデータを扱うといった確率モデルによる識別について述べています。5章では距離による識別としてkNN法について述べています。6~8章では識別関数による識別について書かれていて、6章では線形判別関数、7章ではパーセプトロンと逆誤差伝搬法、8章ではサポートベクトルマシンと、それぞれ異なるトピックが書かれています。9章はデータの次元を縮約して識別する方法が述べられ、主成分分析や部分空間法といった内容が入っています。10章では教師なしデータの識別としてクラスタリングについて書かれていて、最後の11章では識別器を組み合わせて性能を上げる例として決定木が紹介されていて、バギング、アダブースト、ランダムフォレストにも触れられています。これだけ幅広く書かれていてボリュームは200ページほどで、相当コンパクトだと思います。コンパクトゆえに数学や統計の事前知識がないと読みにくいですが、仕方ないですね。

以下にメモとして分からない箇所を挙げておきます(もし知ってる人がいたら教えてほしいです...)
・7章のパーセプトロンの識別規則の式(7.6)の変形(自分で考えると\boldsymbol{w}^T\boldsymbol{x}_i\leq{h}||\boldsymbol{w}||にしかたどり着けなくて、\boldsymbol{w}^T\boldsymbol{x}_i\leq{h}にならない)。
・8章のラグランジュの未定乗数法で、主問題から相対問題が導出される理由がイマイチ理解しきれない。
・9章の章末問題9.4の、射影行列のべき等律(\boldsymbol{P}_i^2=\boldsymbol{P}_i)を示す問題が分からない。
・10章の混合正規分布モデルを用いたクラスタリングEMアルゴリズムが、式は追えてもイマイチイメージがわかない。
細かいことも含めたらもう少しあるのですが、とりあえず自分で把握してる疑問点はこんな感じですね。

とまあ、ざっと所感を書きました。個人的には難しいけど歯が立たないほど難しくもなく、良い難易度の本だったと思います。では、この辺で。


追記:データサイエンティストかそれに近い職種に就きたいけど、企業の探し方がよく分からぬ…