AIスタートアップ企業のElevenLabsは、インタラクティブな音声AIエージェントを構築できる「Conversational AI」を発表した。多様な用途の会話型AIエージェントを構築できるという。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
AI(人工知能)スタートアップ企業のElevenLabsは2024年12月3日(米国時間)、会話型AIエージェントを構築できる「Conversational AI」を発表した。
Conversational AIはインタラクティブな会話型AIエージェントを構築するためのオールインワンプラットフォームだ。Conversational AIを使用することで、インタラクティブなゲームキャラクター、チューター、カスタマーサポートエージェントなど、多様な用途の会話型AIエージェントを作成できるという。
「Conversational AIは、話者が話し終えるタイミングを予測することで、会話の進行を管理し、途中で話を遮るケースでも円滑に対応できる。AIエージェントを構築する方法はシンプルであり、ユーザーはエージェントのカスタマイズに専念できる」と、ElevenLabsは述べている。
Conversational AIは、リアルな音声を生成するText to Speech(テキスト読み上げ)やSpeech to Text(音声のテキスト化)、選択可能なLLM(大規模言語モデル)、そして自然な会話を実現するための独自機能を連携させることで、次のようなカスタマイズが可能になっているという。
ElevenLabsによると、よりインタラクティブなエージェントの構築を支援するため、次のような開発者向け機能も備えているという。
Conversational AIのWebダッシュボードから、AIエージェントを構築し、独自にカスタマイズできる。Webダッシュボードには、音声設定や会話の分析機能が組み込まれており、会話の文字起こしデータから特定のデータを抽出したり、AIエージェントの精度を向上させるための評価基準を設定したりすることもできるという。
ElevenLabsは、Conversational AIのカスタマイズを支援するためのPython/JavaScript/React/Swift向けのSDK(ソフトウェア開発キット)を公開している。独自のLLMやサーバと接続したり、WebSocket APIと統合したりする方法を公式ドキュメントページで解説している。
Copyright © ITmedia, Inc. All Rights Reserved.