用語「プロンプトエンジニアリング」について説明。チャットAI(大規模言語モデル)や画像生成AIなどの生成系AIで、より望ましい返答テキストや画像などが生成されるように、ユーザーがAIモデルに入力する質問や指示のプロンプト(=テキスト)を工夫することを指す。
大規模言語モデル(LLM)によるチャットAIや画像生成AIなどの生成系AIにおけるプロンプトエンジニアリング(Prompt Engineering)とは、より望ましい生成結果(返答テキストや画像など)が得られるように、ユーザーがAIモデルに入力する質問や指示のテキスト(=プロンプト:Prompt)を工夫することである。
プロンプトエンジニアリングは、特に自然言語処理(NLP:Natural Language Processing)で重要だ。例えば、ChatGPTのようなチャットAIに質問する場合、「Pythonとは?」というプロンプトはあまり効果的ではないかもしれない。このプロンプトは例えば以下のように工夫した方が、より望ましい生成結果が得られる可能性が高い。
大規模言語モデルで有効な(=研究論文で効果が示された)プロンプトエンジニアリングの代表的なテクニックに、「ゼロショット学習(Zero-shot Learning)」「フューショット学習(Few-shot Learning)」「思考の連鎖(CoT:Chain-of-Thought)」などがある。これらについて詳しくは各リンク先の用語解説を一読してほしい。さらに「Prompt Engineering Guide」という日本語で書かれたプロンプトエンジニアリングのガイドもあるので、こちらも併せて参照するとよい。
また、コンピュータビジョン(CV:Computer Vision)における画像生成AIでも、プロンプトエンジニアリングは重要である。同様に、以下のような工夫が考えられる。
画像生成については、2022年7月に公開された『The DALL·E 2 Prompt Book』(英語)などの資料がある。AIイラストの分野は、ユーザーによりさまざまな工夫が考案されている。「呪文」などと呼ばれているため、「<画像生成AI名> 呪文」、例えば「Stable Diffusion 呪文」でGoogle検索すればよい。多数のサイトが見つかるはずなので、それらを参考にしてほしい。
Copyright© Digital Advantage Corp. All Rights Reserved.