特徴量エンジニアリング (feature engineering)¶

定義 (Definition)¶

生の音声信号や画像の生のピクセル値からの学習、あるいは任意の長さの文と外国語のそれとの間のマッピングなど、これまでに議論してきた問題はディープラーニングが優れており、従来の手法が行き詰まる問題である。これらの多層モデルは、低レベルの知覚データに、これまでのツールではできなかった方法で対処できることが判明している。ディープラーニング手法における最も重要な共通点は、おそらくエンドツーエンドの訓練（end-to-end training）である。つまり、個別に調整されたコンポーネントに基づいてシステムを構築するのではなく、システムを構築し、それらの性能を結合的に調整するのである。例えば、コンピュータビジョンにおいて科学者たちはかつて、特徴量エンジニアリング（feature engineering）のプロセスを、機械学習モデルを構築するプロセスから分離していた。Cannyエッジ検出器 (Canny, 1987) とLoweのSIFT特徴量抽出器 (Lowe, 2004) は、画像を特徴量ベクトルにマッピングするためのアルゴリズムとして10年以上にわたって君臨した。過去の時代には、これらの問題に機械学習を適用する際の重要な部分は、浅いモデル（shallow models）に適した形式にデータを変換するための手動で設計された方法を考え出すことであった。残念ながら、アルゴリズムによって自動的に実行される何百万もの選択肢にわたる一貫した評価と比較すると、人間の独自の設計によって達成できることには限りがある。ディープラーニングが主導権を握ったとき、これらの特徴量抽出器は、優れた精度をもたらす自動的に調整されたフィルターに置き換えられた。

参照 (Reference)¶

この用語の詳細な文脈については Dive into Deep Learning の対応する章を参照してほしい: - 元章で読む