ElevenLabs、コーディングなしで会話型AIエージェントを構築できる「Conversational AI」を発表 AIを自分の声にカスタマイズも可能:開発者向けSDKも提供
AIスタートアップ企業のElevenLabsは、インタラクティブな音声AIエージェントを構築できる「Conversational AI」を発表した。多様な用途の会話型AIエージェントを構築できるという。
AI(人工知能)スタートアップ企業のElevenLabsは2024年12月3日(米国時間)、会話型AIエージェントを構築できる「Conversational AI」を発表した。
Conversational AIはインタラクティブな会話型AIエージェントを構築するためのオールインワンプラットフォームだ。Conversational AIを使用することで、インタラクティブなゲームキャラクター、チューター、カスタマーサポートエージェントなど、多様な用途の会話型AIエージェントを作成できるという。
「Conversational AIは、話者が話し終えるタイミングを予測することで、会話の進行を管理し、途中で話を遮るケースでも円滑に対応できる。AIエージェントを構築する方法はシンプルであり、ユーザーはエージェントのカスタマイズに専念できる」と、ElevenLabsは述べている。
Conversational AIの主な機能と特徴
Conversational AIは、リアルな音声を生成するText to Speech(テキスト読み上げ)やSpeech to Text(音声のテキスト化)、選択可能なLLM(大規模言語モデル)、そして自然な会話を実現するための独自機能を連携させることで、次のようなカスタマイズが可能になっているという。
- ナレッジベースの構築
- システムプロンプトの設定
- 関数呼び出しによるアプリケーションとの連携
- AIエージェントの音声変更(自分自身の声に変更することも可能)
ElevenLabsによると、よりインタラクティブなエージェントの構築を支援するため、次のような開発者向け機能も備えているという。
- 通話処理のためのTwilioとのネイティブ統合
- 柔軟性を高めるサーバサイドおよびクライアントサイドのツール呼び出し
- パーソナライズされた会話を生み出す動的プロンプティング
AIエージェントの構築方法は?
Conversational AIのWebダッシュボードから、AIエージェントを構築し、独自にカスタマイズできる。Webダッシュボードには、音声設定や会話の分析機能が組み込まれており、会話の文字起こしデータから特定のデータを抽出したり、AIエージェントの精度を向上させるための評価基準を設定したりすることもできるという。
ElevenLabsは、Conversational AIのカスタマイズを支援するためのPython/JavaScript/React/Swift向けのSDK(ソフトウェア開発キット)を公開している。独自のLLMやサーバと接続したり、WebSocket APIと統合したりする方法を公式ドキュメントページで解説している。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 企業は生成AIのセキュリティリスクとどう付き合うべきか、うっかり情報漏えいやプロンプトインジェクションへの対応方法とは
ChatGPTをきっかけとして、生成AIへの関心が急速な高まりを見せている。だがセキュリティリスクも考える必要がある。企業はリスクを制御しながら、生成AIをどう活用していくべきか、NRIセキュアによる説明をお届けする。 - AIエージェントのリスクやセキュリティ上の脅威を軽減する方法
企業は既に、AIエージェント機能を備えた製品の統合やカスタマイズを進めている。だが、AIエージェントはAIモデルやアプリケーションに関連するリスクに加えて、新たなリスクをもたらす。本稿では、AIエージェントがもたらすリスクやセキュリティ脅威について紹介する。 - OpenAI、AIエージェントのパフォーマンス測定ベンチマーク「MLE-bench」を発表 AIの性能をどう測定?
OpenAIは、機械学習エンジニアリングにおけるAIエージェントのパフォーマンスを測定するベンチマーク「MLE-bench」を論文で発表した。