強化学習(RL:Reinforcement Learning)とは?AI・機械学習の用語辞典

用語「強化学習」について説明。プログラムの行動に対するフィードバック(報酬・罰)をトレーニングデータとして使って学習する方法を指す。

» 2019年04月06日 05時00分 公開
[一色政彦デジタルアドバンテージ]
「AI・機械学習の用語辞典」のインデックス

連載目次

用語解説

 強化学習(RL:Reinforcement Learning)とは、プログラムの行動に対するフィードバック(報酬・罰)をトレーニングデータとして使って学習する方法のことである。参考イメージとして例を挙げよう。犬のしつけで、「お座り」という命令で犬が座るようにしつけたい場合、実際にお座りができたら報酬として餌をあげるようにすると、何度も何度も繰り返しトレーニングするうちに「お座り」を学習するが、これと同じ原理である(図1)。

図1 強化学習のイメージ 図1 強化学習のイメージ

 強化学習によって、「次に最も取るべき行動方針」のモデルが構築できる。このため、囲碁や将棋、ゲームなどのプレイや、自動運転の一部技術などに使われている。

「AI・機械学習の用語辞典」のインデックス

AI・機械学習の用語辞典

Copyright© Digital Advantage Corp. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。