ウェイクワード (wake word)

定義 (Definition)

「Alexa」、「OK Google」、「Hey Siri」などのウェイクワード(wake word)に応答するプログラムを書くことだけを想像してみよう。図 1.1.1 に示されているように、コンピュータとコードエディタだけが置かれた部屋で、一人でコーディングを試みてほしい。第一原理からそのようなプログラムをどのように書くのだろうか? 考えてみてほしい… この問題は困難である。マイクは毎秒およそ44,000のサンプルを収集する。各サンプルは音波の振幅の測定値である。生の音声の短い断片を、その断片にウェイクワードが含まれているかどうかについての確信を持った予測 \(\{\textrm{yes}, \textrm{no}\}\) に、高い信頼性でマッピングできるルールとはどのようなものだろうか? 行き詰まっても、心配する必要はない。私たちも、そのようなプログラムをゼロから書く方法は知らない。だからこそ、機械学習を使用するのである。

参照 (Reference)

この用語の詳細な文脈については Dive into Deep Learning の対応する章を参照してください: - 元章で読む