用語「テストデータ」について説明。完成候補のモデルに対して使う最終テスト用のデータを指す。
テストデータ(test data)とは、完成候補のモデルに対して使う最終テスト用のデータのことである(図1)。
機械学習モデルの学習やチューニングに使用したデータは、良い結果が出るようにバイアスがかかっている可能性がある。そういったバイアス問題などを回避するためにも、最終テストには全く未使用のデータを使った方がいいので、通常は、トレーニングデータとは別にテストデータを用意しておく。
Copyright© Digital Advantage Corp. All Rights Reserved.