5. 多層パーセプトロン（MLP）とは：深層学習の基礎構造¶

多層パーセプトロン（MLP: Multi-Layer Perceptron）とは、単層パーセプトロンを複数層に積み重ね、非線形な活性化関数を組み合わせることで、複雑なパターンを学習できるようにしたネットワーク構造であり、現代の深層学習の出発点の一つである。

この章では、最初の本格的な深いネットワークを導入する。
最も単純な深層ネットワークは多層パーセプトロンと呼ばれ、複数のニューロン層から構成される。各層は、その下の層（そこから入力を受け取る）およびその上の層（そこへ出力を渡す）にあるニューロンと全結合している。
自動微分によって深層学習アルゴリズムの実装は大幅に容易になるが、深層ネットワークにおいて勾配がどのように計算されるかも詳しく扱う。
続いて、数値安定性とパラメータ初期化の問題を議論する。これらは深層ネットワークを適切に学習させるうえで重要である。
このような高容量のモデルを学習すると、過学習の危険が生じる。したがって、深層ネットワークにおける正則化と汎化も改めて取り上げる。
全体を通して、概念だけでなく、深層ネットワークを実際に用いる際の要点についても確かな理解を得ることを目指す。
この章の最後では、ここまでに導入した内容を実際の事例、すなわち住宅価格予測に適用する。計算性能、スケーラビリティ、効率性に関する問題は後続の章で扱う。