検索
連載

強化学習(RL:Reinforcement Learning)とは?AI・機械学習の用語辞典

用語「強化学習」について説明。プログラムの行動に対するフィードバック(報酬・罰)をトレーニングデータとして使って学習する方法を指す。

PC用表示 関連情報
Share
Tweet
LINE
Hatena
「AI・機械学習の用語辞典」のインデックス

連載目次

用語解説

 強化学習(RL:Reinforcement Learning)とは、プログラムの行動に対するフィードバック(報酬・罰)をトレーニングデータとして使って学習する方法のことである。参考イメージとして例を挙げよう。犬のしつけで、「お座り」という命令で犬が座るようにしつけたい場合、実際にお座りができたら報酬として餌をあげるようにすると、何度も何度も繰り返しトレーニングするうちに「お座り」を学習するが、これと同じ原理である(図1)。

図1 強化学習のイメージ
図1 強化学習のイメージ

 強化学習によって、「次に最も取るべき行動方針」のモデルが構築できる。このため、囲碁や将棋、ゲームなどのプレイや、自動運転の一部技術などに使われている。

Copyright© Digital Advantage Corp. All Rights Reserved.

ページトップに戻る