AIエージェントは実運用の時代へ　1300人調査で見えたAIエージェントの現在位置：Deep Insider Brief ― 技術の“今”にひと言コメント

LangChainが実施した最新調査により、AIエージェントの導入が急速に進んでいる実態が明らかになった。1300人以上の専門家へのアンケートから見えた、AIエージェントの状況と課題を見てみよう。

[かわさきしんじ，Deep Insider編集部] PC用表示関連情報

LINE

Hatena

連載目次

　AI開発フレームワークを手掛けるLangChainは2025年12月、AIエージェント開発の現状をまとめたレポート「State of Agent Engineering」を公開した。以下ではその調査結果を簡単に紹介していく。

State of Agent Engineering
※https://www.langchain.com/state-of-agent-engineeringより引用

　「State of Agent Engineering」は2025年11月から12月にかけて1300人以上のエンジニアやビジネスリーダーを対象に行われた調査の結果をまとめたものだ。

　最大の注目点は、AIエージェント（自律的に判断してタスクをこなすAI）の実用化が進んでいることだ。回答者の57％が既に本番環境でエージェントを稼働させていると答えた。これは昨年の51％から増加しており、特に従業員1万人以上の大企業では67％に達している。

　一方で、AIエージェント導入の課題となったのは「出力の品質」である。回答者の32％がこれを一番の課題とした。次いで「反応時間」が20％で続いている。また、規模が大きな企業ではセキュリティも懸念材料として考えられている。なお、コストについてはモデルの価格の低下や効率性の向上などにより、この1年で大きな課題とは感じられなくなっているようだ。

　この他、エージェントを監視（トレース）する機能が何らかの形で実装される、複数のモデルが広く使われるようになってきた、といったことが調査からは分かる。

　どうも。HPかわさきです。

　この調査結果、個人的には興味深く読みましたが、果たして日本国内ではこうした状況になっているのかどうかがよく分かりません。恐らくはこの記事で示しているよりも、AIエージェントの導入率は低いんじゃないかなー。また、この調査はLangChainが行ったもので、その調査対象も恐らくはLangChainに関心のある層になっている可能性があります。そういうわけで、日本国内の状況とはかなりの差があるかもしれない点には注意してください。あくまでも「世界の先端ではこんな感じ」なことを知るよい資料だと思いましょう（ホントかな？）

　以下ではレポートを細かく見ていこう。

AIエージェントは実運用の段階に

　回答では57％がエージェントをプロダクション環境で運用、30％が具体的な計画とともにエージェントの開発に当たっているとのこと。以下の画像から分かるように、2024年と比べるとプロダクション環境での使用は51％から57％に伸びて、開発は38％から30％に低下している。開発から実際の使用へとステージが変わってきたことを示している。

2024年の調査結果と2025年の調査結果
プロダクション環境でのAIエージェントの使用が51％から57％に伸びていることが分かる（※https://www.langchain.com/state-of-agent-engineeringより引用）

　1万人以上の規模の企業ではこの割合は67％とさらに大きくなる。一方、100人未満の企業では50％程度と大企業と比べるとAIエージェントはまだそれほど普及していないといえる。

エージェントのユースケース

　エージェントのユースケースとしてはカスタマーサービスが最も多く27％、その次に研究／データ分析が24％、少し離れて組織内での生産性向上が18％となっている。

AIエージェントのユースケース
※https://www.langchain.com/state-of-agent-engineeringより引用

　カスタマーサービス用途でのAIエージェントの導入率が高いことは、組織内での使用だけではなく、客先でのエージェントの直接的な使用が増えていることを示している。

　ただし、大企業では組織内での生産性向上のためにAIエージェントを使う割合が27％になっている。大企業では社内チームの効率化を推進することが、エンドユーザーとのやりとりでAIエージェントを使用するよりも優先されているのかもしれない。

AIエージェント採用の障壁

　AIエージェントを採用する上での障壁として挙げられた要素で上位にくるのは以下の3つだ。

出力の品質（33％）
反応時間（20％）
セキュリティ（16％）

　出力の品質が大きな障害となるのは、去年と同様とのこと。反応時間（レイテンシ）は去年より増えて20％となっている。これは、上で述べた客先でのAIエージェントの使用が増えたことで、その反応時間が重要になってきたことを示している。反応時間は出力の品質とのトレードオフでもあるので、品質と速度のちょうどよいバランスを取ることが重要になってくる。

　一方、コストは去年よりも障壁とは考えられていない。モデルの価格の下落、効率性の向上により、コストに対する関心が薄れてきたと思われる。

AIエージェント導入の障壁は？
※https://www.langchain.com/state-of-agent-engineeringより引用

　なお、大企業では品質の次にセキュリティが25％で続き、反応時間となる点にも注意したい（上の画像は全体のパーセンテージを示したものである）。

エージェントの可観測性（オブザーバビリティ）

　現在ではAIエージェントは多段階の推論や機能呼び出しを行うようになってきた。そのため、これを使うためには、多段階の推論や機能呼び出しを監視（トレース）する機能が必須となってきた。

　調査結果によれば、組織の89％では何らかの形でこれを実装している。62％では、より詳細なトレース機能があり、エージェントがどのような段階を踏んでいるか、どんなツールを呼び出しているかを調べられるようになっている。

エージェントの評価とテスト

　エージェントをトレースするための機能は広く採用されている一方で、エージェントの評価とテストは発展途上にある。とはいえ、テストセットを使用したオフラインの評価を行っているのが52％で、これはデプロイの前に不具合（regression）を発見したり、エージェントの振る舞いを検証したりすることが重要であると考えられていることを示している。一方、プロダクションデータを使ってオンラインで検証している割合は38％で、こちらは現実の世界におけるエージェントの性能を監視するようになったことで、数値としては採用が進みつつある。

モデルとツール

　OpenAIのGPTモデルが最も高い採用率だが（68％）、加えて、Gemini（37％）、Claude（37％）、オープンソースのモデル（34％）など、幅広いモデルが使われるのが一般的になりつつある。また、モデルのファインチューニングはそれほど行われていない（14％）。

日常的に使うエージェント

　最後に、日常的に使うエージェントについては次のような調査結果となっている。

コーディングエージェント：Claude Code、Cursor、GitHub Copilotなど
研究、ディープリサーチ：ChatGPT、Claude、Gemini、Perplexityなど
カスタムエージェント：LangChainやLangGraphを使って開発

　コーディングエージェントとして、日常の開発ループで使われるものとしては調査の中で上記が何度も言及されたとのこと。

Claude Codeについての言及が多い
※https://www.langchain.com/state-of-agent-engineeringより引用

　Claude Code強いですね！　そして、GitHub CopilotよりもCursorの言及数が多いのもビックリ。Claude Codeについての言及の多さはコーディングエージェントとしての人気の高さを、Cursorについてのそれはエディタとしての人気の高さを表しているのでしょうか。筆者はVS Codeばっかり使っていて、これからはGoogle Antigravityも使ってみようと思っていたところ、ちょっと方針変換してみないといけないかも？　と思ってしまいました。

　というか、最後の最後にLangChainが出てきてよかった！