Salesforce AI Researchは、大規模アクションモデル(LAM)と同社のLAM「xLAM」の概要について説明するブログエントリを公開した。LAMは、意思決定やアクションを行える点が特徴だ。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
Salesforce AI Researchは2024年9月6日(米国時間)、大規模アクションモデル(LAM)と同社のLAM「xLAM」の概要について説明するブログエントリを公開した。Salesforce AI Researchは以下のように説明している。
Salesforce AI Researchが開発したxLAMは、関数呼び出し、推論および計画立案用に設計されたLAMだ。xLAMは、ワークフローへのAIの統合を合理化、簡素化し、大規模言語モデル(LLM)の開発・運用で直面することがよくある複雑さの問題を軽減するように設計されている。
LLMは人間が扱うようなテキストを理解し、生成するように設計されている。膨大なデータセットでトレーニングされ、言語関連のタスクを幅広くこなす。LLMは、食欲をそそるレシピを考案し、グルメな料理の作り方を詳しく説明する一流シェフのようなものだと例えることができる。一方、LAMは、さまざまな環境において意思決定を行い、アクションを実行するように設計されている。料理の例で言えば、レシピの考案と詳細な指示だけでなく、切る、混ぜるなどのタスクをこなし、ユーザーが何もしないうちに料理を完璧に仕上げる。
AIの領域では、LAMはLLMの特殊なサブセットで、主に関数呼び出しを通じてアクションを生成するように設計されている。LAMはCRM(顧客関係管理:Customer Relationship Management)の領域で大きな影響を与えており、企業に代わって状況を理解し、適切に意思決定できることが重要になっている。CRM分野では、LAMは単にコンテンツを理解し、生成するだけにとどまらない。ワークフローを自動化し、タスクを管理し、全てがスムーズに進むようにする。
xLAMは、Salesforce AI Researchが開発したLAMファミリーだ。2024年8月12日時点での「Berkeley Leaderboards for Function calling V1」(LLMの関数呼び出し能力を評価するためのベンチマーク)で2位を獲得し、「GPT-4」の幾つかのバリエーションより高い順位を得ている。
xLAMのラインアップは下記の通り。
xLAMのコンパクトバージョンである「Tiny(xLAM-1B)」は、1B(10億)パラメーターを備えている。このモデルのコンパクトなサイズを考えると、大きなモデルが実用的でないオンデバイスアプリケーションに最も適している。
限られたGPUリソースで迅速に学術的な研究を行うために設計された7Bモデル。
8x7Bのエキスパート混合モデルで、レイテンシ、リソース消費、性能のバランスの取れた組み合わせを目指す産業用アプリケーションに適している。
計算リソースが豊富で、ラインアップの中でも最も高い品質を追求したい場合に適した大型のエキスパート混合モデル。
LAMは主にアクションを生み出すために設計されている。このことは、LAMがどのように営業担当者の効率を向上させることができるかでよく分かる。営業担当者が注文をキャンセルするシナリオを例に挙げる。複数のシステムを行き来する代わりに、担当者はAIアシスタントにタスクの処理を依頼するだけで済む。LAMによって動くAIは要求を理解し、注文管理システムが関連するアプリケーションであると判断し、注文をキャンセルするために必要な関数を実行できる。
Copyright © ITmedia, Inc. All Rights Reserved.