5. 多層パーセプトロン¶
この章では、あなたにとって最初の本当の 深い ネットワークを紹介する。
最も単純な深層ネットワークは 多層パーセプトロン
と呼ばれ、複数の層のニューロンから構成される。各層は、その下の層(そこから入力を受け取る)およびその上の層(そこに影響を与える)にあるニューロンと完全に結合されている。
自動微分は深層学習アルゴリズムの実装を大幅に簡単にするが、深層ネットワークにおいてこれらの勾配がどのように計算されるのかを深く掘り下げていくる。
その後、数値安定性とパラメータ初期化に関する問題について議論できるようになる。これらは深層ネットワークをうまく学習させるための鍵となる。
このような高容量モデルを学習すると、過学習のリスクがある。したがって、深層ネットワークにおける正則化と汎化を改めて取り上げる。
全体を通して、概念だけでなく、深層ネットワークを使う実践についてもしっかり理解できるようにすることを目指する。
この章の最後では、ここまでに導入した内容を実際のケース、すなわち住宅価格予測に適用する。計算性能、スケーラビリティ、効率性に関する問題は、後続の章に先送りする。