用語「生成AI」について説明。全く新しいオリジナルのアウトプットを生み出すAI、具体的にはデジタルの画像や動画、オーディオ(音声/音楽など)、文章やコードなどのテキストを生成するAI、もしくはこれらを組み合わせて生成するAIのことを指す。
生成系AI(生成AI、GenAI、ジェネレーティブAI:Generative AI、生成型AI)とは、クリエイティブかつ現実的な全く新しいオリジナルのアウトプットを生み出す人工知能(AI)のことで、具体的には新しいデジタルの画像や動画、オーディオ(音声/音楽など)、文章やコードなどのテキストを生成するAI、もしくはこれらを組み合わせて生成するAIのことを指す。そのAIは通常、データ/コンテンツから学習するディープラーニング(その中でも特にTransformerといった最近の技術)により構築された非常に大規模な機械学習モデルとなっている。画像を生成できるAIの「Stable Diffusion」や、テキストを生成できるAIの「ChatGPT」などがその代表である(図1)。
2022年8月前後に、美麗な画像を生成できるMidjourneyなどの生成系AIが登場し、誰でも試しやすいことから一般社会の注目を集めた。その後、前述のStable DiffusionやChatGPTなどの新しい生成系AIが次々と登場し、改訂時点(2024年1月)の今でもそのブームが続いている(参考:「2024年の『AI/機械学習/データ分析』はこうなる! 7大予測」)。
2022年8月以降で生成系AIがブームになるまでは、人間と同等以上の成果を出したAIとして、主にディープラーニングによって文字を認識するAIや画像から物体を認識するAIなどの、いわば「認識系AI/識別系AI(Discriminative AI)」が主流であった。その時代のAIと明確に区別するために、あえて単に「AI」ではなく「生成系AI」と呼ばれている、と考えられる。筆者が調べた限りでは「Generative AI」という用語は、画像生成モデルの一つであるGAN(Generative Adversarial Networks:敵対的生成ネットワーク)と絡める形で2020年頃から徐々に使われるようになってきたようである。Gartner(ガートナー)が2020年8月に発表した「先進テクノロジのハイプ・サイクル:2020年」には既に「生成的AI(Generative AI)」が記載されている。
2024年4月8日:英語圏で一般的になっている「GenAI」を追記しました。それに合わせて記事タイトルを修正しました。
2024年1月15日:読みづらかった部分を修正しました。また、改訂時点(2024年1月現在)視点に情報をアップデートしました。
Copyright© Digital Advantage Corp. All Rights Reserved.