検索
ニュース

ElevenLabs、コーディングなしで会話型AIエージェントを構築できる「Conversational AI」を発表 AIを自分の声にカスタマイズも可能開発者向けSDKも提供

AIスタートアップ企業のElevenLabsは、インタラクティブな音声AIエージェントを構築できる「Conversational AI」を発表した。多様な用途の会話型AIエージェントを構築できるという。

Share
Tweet
LINE
Hatena

 AI(人工知能)スタートアップ企業のElevenLabsは2024年12月3日(米国時間)、会話型AIエージェントを構築できる「Conversational AI」を発表した。

 Conversational AIはインタラクティブな会話型AIエージェントを構築するためのオールインワンプラットフォームだ。Conversational AIを使用することで、インタラクティブなゲームキャラクター、チューター、カスタマーサポートエージェントなど、多様な用途の会話型AIエージェントを作成できるという。

Conversational AIの紹介動画(提供:ElevenLabs)

 「Conversational AIは、話者が話し終えるタイミングを予測することで、会話の進行を管理し、途中で話を遮るケースでも円滑に対応できる。AIエージェントを構築する方法はシンプルであり、ユーザーはエージェントのカスタマイズに専念できる」と、ElevenLabsは述べている。

Conversational AIの主な機能と特徴

 Conversational AIは、リアルな音声を生成するText to Speech(テキスト読み上げ)やSpeech to Text(音声のテキスト化)、選択可能なLLM(大規模言語モデル)、そして自然な会話を実現するための独自機能を連携させることで、次のようなカスタマイズが可能になっているという。

  • ナレッジベースの構築
  • システムプロンプトの設定
  • 関数呼び出しによるアプリケーションとの連携
  • AIエージェントの音声変更(自分自身の声に変更することも可能)

 ElevenLabsによると、よりインタラクティブなエージェントの構築を支援するため、次のような開発者向け機能も備えているという。

  • 通話処理のためのTwilioとのネイティブ統合
  • 柔軟性を高めるサーバサイドおよびクライアントサイドのツール呼び出し
  • パーソナライズされた会話を生み出す動的プロンプティング

AIエージェントの構築方法は?

 Conversational AIのWebダッシュボードから、AIエージェントを構築し、独自にカスタマイズできる。Webダッシュボードには、音声設定や会話の分析機能が組み込まれており、会話の文字起こしデータから特定のデータを抽出したり、AIエージェントの精度を向上させるための評価基準を設定したりすることもできるという。

Webダッシュボードのイメージ(提供:ElevenLabs)
Webダッシュボードのイメージ(提供:ElevenLabs)

 ElevenLabsは、Conversational AIのカスタマイズを支援するためのPython/JavaScript/React/Swift向けのSDK(ソフトウェア開発キット)を公開している。独自のLLMやサーバと接続したり、WebSocket APIと統合したりする方法を公式ドキュメントページで解説している。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る