LLMアプリケーションを構築するための5つのステップをGitHubが解説:「LLMを使わないソフトウェアの構築とは根本的に異なる」
GitHubは、LLMアプリケーションを構築するために知っておくべき5つのステップを公式ブログで紹介した。
GitHubは2023年10月30日(米国時間)、LLMアプリケーションを構築するために知っておくべき5つのステップを公式ブログで紹介した。
LLMアプリを構築する5つのステップ
同社は、LLMやあらゆる機械学習(ML)モデルを使ったソフトウェアの構築は、LLMを使わないソフトウェアの構築とは根本的に異なると主張している。一連のコマンドを実行するためにソースコードをバイナリにコンパイルするのではなく、開発者は一貫性のある正確な出力を生成するために、データセット、エンベッディング、パラメーターの重みをナビゲートする必要があることが要因の一つだという。
1.1つの問題に集中する
重要なのは、適切な大きさの問題を見つけること。すぐに反復して前進できるように十分に集中しているが、適切なソリューションがユーザーを驚かせるのに十分な課題感がふさわしい。
例えば、GitHub Copilotチームは、開発者が抱える全ての問題をAI(人工知能)で解決しようとするのではなく、最初はソフトウェア開発ライフサイクルの一部分、つまりIDEでの関数のコーディングに焦点を当てた。
2.適切なLLMを選択する
事前に訓練されたモデルでLLMアプリを構築することでコストを節約できるが、適切なものを選ぶにはどうすべきか。考慮すべき要素を幾つか次に挙げる。
ライセンス
最終的にLLMアプリを販売したい場合は、商用利用が許可されたAPIを持つモデルを使用する必要がある。
モデルのサイズ
LLMのサイズは、70億から1750億パラメータほどだが、3億5000万パラメータといった小さいものもある。ほとんどのLLMは(執筆時点で)70億から130億のパラメータを持つ。
従来の常識では、モデルのパラメータ(モデルの出力を向上させるために調整可能な変数)が多ければ多いほど、モデルは新しい情報を学習し、予測を提供する能力が高くなると考えられてきた。しかし、より小さなモデルの性能向上は、その考えを覆しつつある。小型モデルは、より高速で安価でもある。こうしたモデルの予測の質が向上したことで、有名なモデルを適用しにくい数々のアプリケーションにおいて有力な選択肢となり得る。
3.LLMをカスタマイズする
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- GitHubが「GitHub Copilot」開発で得た教訓、LLMアプリケーション開発のベストプラクティスとは
GitHubは、「GitHub Copilot」の開発から公開における同社の経験を振り返り、個人と企業の両方に大きな価値を提供するLLM(大規模言語モデル)アプリケーションの開発に役立つ教訓として紹介した。 - RustでWebアプリの実装にチャレンジしてみよう【準備編】
Rustを使った「Webアプリ」の開発はどのようなものになるのでしょうか? 本連載のスタートとなる今回は、アプリ開発の下準備として、Rustの現状を踏まえた連載の目的を紹介し、Webアプリ開発環境の構築を通じて、Rustのプロジェクト管理の基本をおさらいします。 - RLHF(人間のフィードバックによる強化学習)とは?
用語「RLHF」について説明。人間のフィードバックを使ってAIモデルを強化学習する手法を指す。OpenAIのChatGPT/InstructGPTでは、人間の価値基準に沿うように、言語モデルをRLHFでファインチューニング(微調整)している。