検索
連載

AIエージェント(AI Agent)とは?AI・機械学習の用語辞典

用語「AIエージェント」について解説。特定の目標を達成するために、必要なタスクを自律的に作成し、計画的に各タスクを実行するAIシステムのこと。これにより、人間の作業を大幅に自動化できる可能性がある。また、複数のAIエージェントを組み合わせることで、より高度な自動化が期待されるAIマルチエージェントも登場している。

PC用表示 関連情報
Share
Tweet
LINE
Hatena
「AI・機械学習の用語辞典」のインデックス

連載目次

用語解説

 AI(人工知能)分野におけるAIエージェントAI Agent)とは、特定の目標を達成するのに必要なタスクを自律的に作成し、計画的に各タスクを実行するAIシステム(またはソフトウェアプログラム)である。人間がゴールとなる目標だけを設定すれば、AIエージェントは基本的に以下のような作業を自動で行う(図1)。

  • 目標達成に必要なタスクの洗い出し(ゴールとなる目標を実行可能な小さいタスクに分割し、その実行順序を計画)
  • 各タスクの順次実行(エラーが発生した場合、条件を調整して再試行)
  • 状況に応じて、必要なプログラムの生成と実行(例:Python言語でコードを生成して実行)
  • 状況に応じて、情報の収集と分析(例:Webサイトからデータを収集して解析)
  • 状況に応じて、環境との相互作用(例:データベースへの書き込みや、外部APIとの連携など)
  • 実行結果の評価(必要に応じて計画を修正して再試行)
図1 AIエージェントのイメージ
図1 AIエージェントのイメージ

 「人間(ユーザー)」が判断して生成AI(チャットAIなど)を直接利用する場合と異なり、AIエージェントは、目標達成に至るプロセスを「自律的」に判断して遂行する(その過程で内部的に生成AIを活用する)。そのため、自律型AIエージェントAutonomous AI Agent)とも呼ばれる。ChatGPTなど生成AIの次のステップとして注目されている。

具体的な利用シーン(想定例)

 用語の定義だけではイメージしにくい人もいるかもしれないので、ここでAIエージェントの具体例を紹介しよう。例えば、営業担当者が「売上を伸ばしたい」と考えており、「新商品を購入した人は、追加で付属品を買う確率が高いだろう」と仮定しているとする。そこで、

  • 「新商品購者全員に、付属品の半額クーポンを電子メールで自動送付」

という目標をAIエージェントに設定する。この場合、AIエージェントは目標を達成するために、次のような小タスクを考案し、順次実行していく。

  1. 購買データベースから新商品購入者を抽出して分析
  2. 付属品を半額で提供するクーポンを生成
  3. クーポンを添付して電子メールで送信
  4. 送信状況をレポートにまとめる

 他にも以下のような利用シーンが考えられる(あくまで想定例であることに注意してほしい)。

  • 「株価データをリアルタイムに分析し、特定の条件下で売買注文を自動実行」
  • 「顧客の購買履歴を分析し、パーソナライズされたお薦め商品リストを作成して電子メールを自動送信」
  • 「IoTデバイスからのセンサーデータを分析し、家庭内のエネルギー使用を自動的に最適化」
  • 「高校生の学習進行具合を追跡し、個別の弱点に合わせた演習問題を自動生成」
  • 「カスタマーサポートの音声通話をリアルタイムに分析し、カスタマーハラスメントに自動対応」

 AIエージェントは、これらのシーンで必ずしも確実に動作するわけではないが、私たち人間が行う一連の作業を大幅に自動化したり、人間と協働したりすることで、生産性向上に大きく貢献することが期待されている。

 ただし、AIエージェントの導入に当たっては、プライバシー保護やセキュリティ対策、リスク管理といった課題にも十分な配慮が必要である。例えば、商品の購入のためにクレジットカード番号や銀行口座のログイン情報といった機密性の高い個人情報をAIエージェントが扱う可能性があり、プライバシーやセキュリティの問題が生じる懸念(リスク)がある。よって、人間による適切な監督と管理が依然として重要であることに留意すべきである。

 2024年11月1日現在はまだ、AIエージェントの実用化が始まりつつある黎明(れいめい)期だが、今後、AIエージェントの開発や活用に本格的に取り組む企業が増えていき、この分野が一大ブームになっていく可能性が高いと考えられる。すでに利用可能、もしくは開発中のAIエージェントが多数存在するため、その代表的なツールや最新の機能について次節で紹介する。

AIエージェントの代表的なツールや最新の機能

 筆者が初めてAIエージェントに触れたのは、2023年7月に有料会員向けに一般公開されたChatGPTの旧「Code Interpreter」(後に「高度なデータ分析:Advanced Data Analysis」、現「データアナリスト:Data Analyst」)である。これは、データ分析やデータの可視化、プログラミングなどを全自動で行う機能で(参考記事)、その内部ではPythonコードを自動的に生成して実行し、エラー発生時には原因を自ら特定してコードを自己修正しながら成功するまで再試行する機能を備えている。

 2023年4月にはオープンソースのAIエージェントツールであるAutoGPTが登場し(他にはBabyAGIやAgentGPTなどもある)、「AIエージェント」の概念が広く認知されるきっかけとなった。また、大規模言語モデル(LLM)を活用したアプリケーションを開発できるPythonライブラリ「LangChain」と組み合わせてAIエージェントを構築できるPythonライブラリ「LangGraph」も2023年1月に登場し、AIエージェント(や後述のAIマルチエージェント)の実装が手軽に行えるようになっている

 2024年10月には、AnthropicのLLMである「Claude 3.5 Sonnet」モデルに「Computer use(コンピューターの使用)」機能(ベータ版)が導入され、AIエージェントが人間と同じようにマウスやキーボードでPCのGUI画面を直接操作できるようになった。これにより、APIが提供されていないアプリケーションにも対応可能となり、従来はRPA(ロボティック・プロセス・オートメーション)ツールで行っていた定型作業などの自動化も、今後はAIエージェントが代替できる未来が見えてきている。

 2024年11月1日現在では、「GoogleがWebブラウザのChromeに搭載するAIエージェント(コード名:Project Jarvis)を開発中で、早ければ2024年12月にはリリースされる」という噂(うわさ)が流れている(参考記事)。Project Jarvisは、ブラウザ上のさまざまなユーザー操作(タスク)を自動化する機能を有しており、例えばインターネットからの情報収集や、最安での商品の購入、旅行のための飛行機予約などが行えるだろう。

 このようにAIエージェントは、プログラムコードの生成と実行に加え、物理的なPC操作まで幅広い作業を実行できるようになるなど、技術の進化を続けている。

複数のAIエージェントとの連携:AIマルチエージェント

 最近では、異なる役割を持つ複数のAIエージェントが自律的に連携するAIマルチエージェントAI Multi-Agent)の実装や研究が進められている。これにより、より複雑で高度なタスクの自動化が期待されている。

 具体例(あくまで想定例)としては、購買データを分析し特定顧客に合ったプロモーションを提案する「プロモーションAIエージェント」と、季節ごとに最適な割引率を設定する「価格最適化AIエージェント」が連携することで、より効果的な販促メールを自動で送信する「AIマルチエージェント」などが考えられる。

 AIマルチエージェントの代表的な実装例として、2024年10月にOpenAIが公開したSwarmという実験的な軽量Pythonフレームワークが挙げられる。ただしSwarmは、汎用(はんよう)ライブラリではなく、教育目的のサンプル実装として提供されている点に注意が必要だ。

 1つの巨大なAIエージェントを作るAIシングルエージェントAI Single-Agent)よりも、小規模で制御しやすい複数のAIエージェントを組み合わせるAIマルチエージェントの方が、複雑なタスクを柔軟かつ効率的に自動化できる可能性が高いと考えられる。よって今後は、この新しい「AIマルチエージェント」にも要注目である。

「AI・機械学習の用語辞典」のインデックス

AI・機械学習の用語辞典

Copyright© Digital Advantage Corp. All Rights Reserved.

[an error occurred while processing this directive]
ページトップに戻る