サンプル (sample)¶
定義 (Definition)¶
データなしにデータサイエンスを行うことはできないのは言うまでもない。データとは正確には何であるかを考察することで数百ページを費やすこともできるが、ここでは、私たちが扱うデータセットの重要な性質に焦点を当てる。一般的に、私たちはデータ例の集合を扱う。データを有用に利用するためには、通常、適切な数値表現を考案する必要がある。各データ例(example、あるいはデータポイント(data point)、データインスタンス(data instance)、サンプル(sample))は、モデルがそれに基づいて予測を行うために使用する、特徴量(features、時には共変量(covariates)や入力(inputs)とも呼ばれる)と呼ばれる属性の集合から構成される。教師あり学習の問題において、私たちの目標は、モデルの入力には含まれない、ラベル(label、あるいはターゲット(target))と呼ばれる特別な属性の値を予測することである。
参照 (Reference)¶
この用語の詳細な文脈については Dive into Deep Learning の対応する章を参照してください: - 元章で読む