さらに衝撃的な研究があります。Googleの研究チームが「Towards a Science of Scaling Agent Systems」と題した論文で、マルチエージェントシステムのスケーリング特性を定量的に分析しました。この研究は、「エージェントを増やせば賢くなるのか」という素朴な問いに、明快かつ冷徹な結果を出しています。固定の計算予算のもとでは、エージェントを3、4体以上に増やすと、エージェント当たりの推論能力が致命的に薄くなる。通信コストが推論能力を圧倒してしまうのです。
数字で見ると、その深刻さが分かります。集中型のマルチエージェントシステムでは、シングルエージェントに比べてトークン消費量が約3.9倍。分散型で約3.6倍。ハイブリッド型にいたっては約6.2倍です。エージェントを増やせば増やすほど、一体当たりの「考える予算」が削られていく。人間のチームでコミュニケーションコストが爆発するのと、構造としては全く同じです。
ただし、正直に認めるべきずれもあります。AIエージェントには感情がありません。「あの人に聞きにくい」という心理的障壁も、「新しい環境に慣れるまでのストレス」もない。その代わりに、毎回コンテキストをゼロから構築し直すという、人間にはないコストを抱えています。エージェントは学習を蓄積しない。昨日の経験を今日に生かすことができない。もちろん、今日の生成AIツールにはセッションを超えてコンテキストを引き継ぐ仕組みがあります。メモリ機能やルールファイルによって、過去のやりとりの要約や行動指針を次のセッションに持ち越すことができます。しかし、それは圧縮され、選別された「申し送り事項」にすぎません。人間の新メンバーが学習コストを払った後に身につけるのは、マニュアルに書ける明示的な知識だけではなく、「この設計にはこういう背景がある」「このモジュールはこう触ると壊れやすい」といった暗黙知です。メモリ機能が引き継げるのは前者だけであり、後者は毎回のコンテキスト構築で補うしかない。しかもコンテキストを積みすぎれば、今度はモデルの出力品質そのものが劣化するという制約もあります。形は違えど、「増やせば速くなる」という素朴な期待を裏切る構造は、50年前と驚くほど似ているのです。
ここまで読むと、マルチエージェントは使い物にならないように聞こえるかもしれません。しかし現実には、見事に使いこなしている人たちがいます。
Anthropic自身が構築したマルチエージェントリサーチシステムは、リードエージェントが調査戦略を立て、3〜5体のサブエージェントが並行して情報収集と分析を行う構成で、シングルエージェントを90%以上上回る成果を出しています。うまくいっている例に共通するのは、「とりあえず増やした」のではなく、明確な設計思想があるということです。
その設計思想の原型が、実は50年前の古典に描かれていました。「人月の神話」は、問題を指摘して終わる本ではありません。ブルックスはもう一つ、興味深い提案をしています。「外科医チーム」というモデルです。
私は人生で一度だけ手術を受けたことがあります。麻酔で意識が薄れていく中、最後に見えた光景が妙に記憶に残っています。私というたった1人の患者のために、手術室には何人もの医療従事者がいました。私はそのまま眠りに落ちたのですが、おそらくその後の手術室ではこんな風景が展開されていたのでしょう。執刀医がメスを握り、設計と判断の全てを担う。その周囲に、麻酔科医、看護師、助手がそれぞれの専門領域で執刀医を支える。全員が対等に議論するのではなく、1人の「チーフプログラマー」が知的作業の中核を担い、専門スタッフがそれを取り囲む。これがブルックスの提案した理想のチーム構造でした。
当時、この提案はあまり注目されませんでした。「1人に権限を集中させる」という考え方は、民主的なチーム運営の流れに逆行するように見えたからです。しかし50年後の今、この外科医チームモデルが思わぬ形で再評価されています。
驚くべきことに、2026年のマルチエージェント研究が示す最適構成は、この50年前のモデルとぴったり重なるのです。
Copyright © ITmedia, Inc. All Rights Reserved.