社会人から学生まで、今や現代人の大半は生成AIと無縁ではいられないでしょう。もはや“常識”となりつつある用語として「AI」「生成AI」「AGI」「ASI」「AIアライメント」「LLM」「ローカルLLM」「マルチモーダルAI」「エッジAI」「AIエージェント」の10語を紹介します。
最近は生成AIが、さらに私たちの身近な存在になっていますよね。実際、年末年始をチャットAIとの会話で過ごした――といった話も耳にしました。
気付かないうちに触れているケースも少なくありません。例えばGoogle検索すると、AIによる概要文(AI Overview)が検索結果のトップに表示されることがあります。
このように、社会人であろうと学生であろうと、専業主婦であろうと無職であろうと、現代を生きるほとんどの人にとって“生成AI”と無縁でいることは難しいでしょう。そこで本稿では、一般利用者の視点で、生成AIに関する用語を10語だけ厳選し、それぞれの意味をコンパクトに紹介します(図1)。
もはや現代人の“常識”となりつつある必須の基礎知識です。生成AI利用者だけでなく、ぜひ知識ゼロの方にも「まずはこれを読んでおいてね!」と気軽に薦めていただけるとうれしいです。
ちなみに、以前に「生成AIの用語10選 〜 一般ユーザーが知っておくべき基礎知識」(※本稿との違いは「必修」とはしていない点)という記事も公開しています。こちらは本稿と比較すると、企業内でDXを推進する立場の方など、“提供する側”の視点(=基本的な技術要素を大まかに理解しておきたい方向け)で厳選した用語が中心です。よって、特に生成AIを社内に導入し、活用する場合は、本稿と併せてご一読ください。ただし、一部の用語(生成AI、LLMなど)が本稿と重複している点はあらかじめご了承ください。
本連載では、AIや機械学習に関連する専門用語をできるだけかみ砕いて分かりやすく解説しています。コンパクトながらも、必要十分な知識が得られる内容を目指しています。興味がある方は、次回以降の新着記事を見逃さないように、ぜひ以下のメール通知の登録をお願いします。
最初に紹介する「AI」や「生成AI」という言葉は、今や日常的に目や耳にするものとなっていますが、その役割や位置付けをあらためて整理し、それぞれの意味の違いを簡単にまとめていきます。
人工知能(AI:Artificial Intelligence)とは、(データから学習することで)読む/書く/聞く/話すなど人間が行う「知的活動(=知的ふるまい)」を疑似的に実現したコンピュータプログラム(=ソフトウェア)のことです。需要予測などの「分析系AI」から、画像認識などの「識別系AI」、そしてChatGPTのような文章生成を行う「生成系AI」まで、さまざまな「知的活動」を支えるAIが、すでに多くの場面で活用されています。
AIの定義は人や組織によって異なることもありますが、本稿では上記の意味で「AI」を位置付けておきます。
生成AI(GenAI:Generative AI、生成系AI)とは、(基本的に)全く新しいオリジナルのアウトプットを生み出すAIです。具体的には、文章やコードといったテキスト、画像や動画、オーディオ(音声/音楽)などを生成するAIのこと、もしくはそれらを組み合わせて生成するAIのことです。
生成AIはすでに広く普及してきています。例えばChatGPTのようなチャットAIを自身の業務に活用しており、「これがないと仕事が進まない」と感じている方もいらっしゃるのではないでしょうか。また、GitHub Copilotのようなコード生成AIはプログラミングの生産性を飛躍的に高めてくれます。筆者もGitHub Copilotの無料版を使ってみて、久しぶりのプログラミング作業時に大活躍したので、その便利さを実感しました。
汎用人工知能(AGI:Artificial General Intelligence、汎用型AI)とは、人間が行う「知的活動」を完全に模倣できるAIのことです。強いAIとも呼ばれます。イメージするなら「ドラえもん」レベルの知性です。
対となる概念に、特化型AI(別名:弱いAI)があります。これは、「音声認識など特定のタスク(=処理、作業項目)に特化したAI」を意味します。これに対し、汎用型AI(AGI)は「どんなタスクもこなせるAI」です。
AGIの定義は統一されておらず、共通の達成基準も確立されていませんが、本稿では上記のように位置付けました。
現在のAI(特に生成AI)はさまざまなタスクをこなせるようになり、汎用的な知性を評価するテストで人間と同等以上の点数を獲得するAIも出始めています。「どのような基準を満たせばAGIと呼べるのか」は専門家の間でも意見が分かれる可能性がありますが、日進月歩で技術は進化しており、AGIの実現に向けた研究と実用化が現在進行形で進められています。
人工超知能(ASI:Artificial Superintelligence)とは、人間の知能を科学、技術、芸術などあらゆる分野で超越し、自己学習を通じて自律的に成長し続けるAIのことです。先ほど説明した「AGI」が人間と同等の知能を持つのに対し、「ASI」は人間をはるかに超える知能を持つ、という違いがあります。
ASIによって、科学や技術を次のステージへ進めるような画期的な発明や発見が期待されます。その結果、人類の仕事や生活、さらには社会の構造まで、これまでにない劇的な変化をもたらす可能性があると予測されています。
AGIに達する可能性が見えてきた結果、OpenAIなど一部の組織や人が次に考えるべき目標として「ASI」もしくは「Superintelligence(超知能)」という用語を使い始めています。すでに「AGI」という未来のAIに対応する用語が存在するため、「ASI」という用語の必要性に懐疑的な意見もあり、“バズワード”(流行を狙って新たに作られた言葉)と捉えられることもあります。しかし、技術や社会の未来を議論する場面では「ASI」という用語が指針として便利な場合もあり、この用語について知っておくことは有用と考え、今回の必修用語の一つに選出しました。
AIアライメント(AI Alignment)とは、AIシステム(特に大規模言語モデル)が人間の意図や倫理観に沿うように、AIを適切に学習させ、調整するための技術や理念のことです。これにより、AIを社会や人間にとって安全(つまり無害かつ正直)で、役立つ存在にすることを目指します。
AIが一般社会に普及するにつれ、その安全性への対策がより重要視されてきています。このような時代背景の中、「AIアライメント」の重要性と注目度はますます高まっていくでしょう。
大規模言語モデル(LLM:Large Language Models)とは、大量のテキストデータを使って学習した言語モデル(=AI技術を用いて文章を理解し、新しい文章を生成できるソフトウェア)のことです。LLMは、文章を要約したり、テキストを生成したり、質問に応答したりできます。つまりチャットAIの中身です。
チャットAIであるChatGPTの中身の代表例がLLM「GPT-4o」、Geminiの中身が同名のLLM「Gemini 2.0 Flash」、Claudeの中身が同名のLLM「Claude 3.5 Sonnet」です。
チャットAIの中身としてではなく、LLM単体で有名なものもあります。それが「Llama」(ラマ)です。このLlamaをベースとして、日本語に特化させた派生モデル(例えば「Llama-3.1-ELYZA-JP-70B」)などが多数あります。
ローカルLLM(Local LLM)とは、クラウド環境ではなく、ユーザーが所有するローカル環境(自宅のPCや、オフィス内のサーバ、手元にあるスマートフォン、見守りカメラといった家庭用のエッジデバイスなど)で直接動作するLLM(大規模言語モデル)のこと、またはそれを動作させる仕組みのことです。例えば、ノートPCにLLMの一つである「Llama」を入れて、自分だけのチャットボット(チャットAI)を動かす、そんなことがローカルLLMなら可能です。
ローカルLLMでは、データをクラウドに送信せずに、ローカル環境内で処理を完結できます。そのため、個人情報や機密データが外部に送信されるリスクがありません。
また、特定のタスクや業界向けにモデルを調整する場合も容易です。例えば、法律事務所で特定の法律文書に特化したチャットAIを作成するなど、業界特化型の利用に適しています。
さらに、個人が「手元でLLMを動かしたい」という目的でも、ローカルLLMはよく活用されています(参考例:GPT4Allというツールを使う方法)。
エッジAI(Edge AI)とは、エッジデバイス(=スマートフォンや見守りカメラなど、利用者に近い場所にある端末)上で動作するAIのことです。例えば、家にあるスマートホーム機器(例:見守りカメラ)が、データをクラウドに送信せず、そのデバイス内だけでAIによる顔認識を行うことなどが、エッジAIの典型的な例です。
エッジAIは、インターネットのクラウドにデータを送信せずにデバイス内で効率的にデータを処理できるので、応答時間が短縮されます。例えば、見守りカメラが即座に異常を検知して通知を送る場合など、リアルタイム性が求められる場面で役立ちます。また、外部にデータを送信しないため、プライバシーを保護しやすくなるメリットもあります。
なお、先ほど説明した「ローカルLLM」がエッジデバイス上で動作する場合、それは「エッジAI」としても分類されます。
マルチモーダルAI(Multimodal AI)とは、テキスト/画像/音声/数値など複数のデータ種別(=モーダル)を一度に処理できる統合されたAIモデルのことです。
生成AIが大きく注目され始めた2022年ごろは、画像データを扱う「画像生成AI」と、テキストデータを扱う「文章生成AI」のように、1つのデータ形式を処理するシングルモーダルAIが主流でした。2025年現在は、生成AIの多様な用途が広がる中で、テキストも画像も扱えるマルチモーダルAIが主流になっています。今後は「LLM」と呼んでいても、テキストだけでなく画像や音声も処理できるマルチモーダルなモデルである可能性が高いでしょう。
マルチモーダルAIは、人工知能の長期的かつ究極の目標である「AGI」に向けた重要なステップと見なされています。人間のような知能(例:柔軟な意思決定や創造性)を持つ「AGI」を実現するためには、さまざまな形式のデータを一度に理解する「マルチモーダルの能力」と、複数の作業を実行する「マルチタスクの能力」が不可欠です。
この2つの能力が備わることで、例えば人間が写真を見ながらその内容を口頭で説明したり、聞いた指示から作業内容を考えて行動を起こしたりするのと同じような柔軟な判断や実行が、AIでも実現できるようになることが期待されます。
AIエージェント(AI Agent)とは、人間がゴールとなる目標を設定するだけで、その目標を達成するために必要なタスクを自律的に洗い出して、各タスクを優先順位を付けて計画的に実行するAIシステム(またはソフトウェアプログラム)のことです。これにより、例えば日々のルーチンワークなど、人間の作業を大幅に自動化、または効率化できることが期待されます。
AIエージェントは、生成AI登場以来の大きな技術的な飛躍として、2025年現在、最も注目されているトピックの一つです。例えば、Microsoftが提供する「Copilot Studio」では、企業が独自のAIエージェントを構築できます。また、Googleが提供する「Agentspace」では、検索エージェントで社内情報を検索したり、AIエージェントで業務を自動化したりすることが可能です。このようにAIエージェント技術は、特に業務効率化の分野で急速に発展を続けています。
AIエージェントは、単なるLLMやマルチモーダルAIでは難しかった「特定の目標を実行可能な小さいタスクに分解し、それらを効率良くこなすこと」を実現します。例えばマーケティング分野であれば、「データを分析して広告を配信する」という目標に対し、顧客データの分析から最適な広告の生成、配信までを一貫して自動化できることが期待されます。
また、このように自律的に動作させる技術が、AIが人間のように柔軟な判断力と確実な実行力を持つ「AGI」の実現を加速させる大きな鍵となるでしょう。
以上、生成AIがもたらす新時代において、現代人が知っておきたい特に重要な用語を厳選してご紹介しました。本稿が、生成AIの現状と可能性を知るきっかけとなり、日常や業務で効果的に活用するための一助となれば幸いです。Let's enjoy the future evolution of AI together.
Copyright© Digital Advantage Corp. All Rights Reserved.