用語「半教師あり学習」について説明。教師あり学習と教師なし学習を組み合わせて学習する方法を指す。
半教師あり学習(Semi-Supervised Learning)とは、教師あり学習と教師なし学習を組み合わせて学習する方法のことである(図1)。
どう組み合わせるかには、幾つかの手法がある。
代表的な手法としては、「教師なし学習で特徴表現を獲得した後で、教師ありでそのモデルを再学習する方法」がある。他には、「まずは教師ありデータを使ってモデルを作り、それを使って教師なしデータに対する推論の結果(つまり出力データ)を取得する。その出力データの中でも特に精度の高いデータを正解ラベルとして採用し、教師ありデータとして使ってモデルを再学習することで、モデルをさらに強化していく方法」などがある。
このようなステップを踏むことで、少ない教師データしかなくても、通常の教師あり学習よりも精度を高められると一般的にいわれている。
なお、一部ではあるが(※全てでなくてよい)、学習前に正解ラベル(教師データ)を付与したトレーニングデータを作成しておく必要がある。
Copyright© Digital Advantage Corp. All Rights Reserved.