IPテレフォニー最前線 Stable Diffusion、Starlink実戦投入の可能性は?羽ばたけ!ネットワークエンジニア(61)

IPテレフォニー(IP電話)においても生成AIや低周回軌道衛星の利用が可能になった。その最先端の研究事例を紹介する。

» 2023年02月27日 05時00分 公開
[松田次博@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

「羽ばたけ!ネットワークエンジニア」のインデックス

連載:羽ばたけ!ネットワークエンジニア

 筆者が主宰する情報化研究会は2023年1月28日に、第85回研究会「IPテレフォニー最前線」をオンライン開催した。ふだん生成AIに触れることがない筆者には新鮮な内容だった。

 ChatGPT(OpenAIが2022年11月に公開したチャトbot)も名前しか知らなかったが、研究会の後で使ってみた。「企業ネットワークを進化させる3大要因は?」という質問をすると図1の回答が返ってきた。

図1 ChatGPTの回答例

「クラウド」「5G」「IoT」の3つを挙げている。同じ質問を何度かするとその度に違った回答を返す。中には的外れなものもあるが、かなり精度が高いことに感心した。

 さて本論に入ろう。研究会ではIPテレフォニー、特にソフトフォンに強い「ageet」の岡崎昌人氏に、生成AIや低周回軌道衛星通信サービス、Starlinkの研究事例を紹介いただいた。

通話録音の内容を「イメージ」(画像)に要約する

 ネットビジネス全盛の時代になっても、顧客と企業の接点として音声によるコミュニケーションは重要だ。コンタクトセンターなどで顧客との通話は録音される。録音された音声をテキスト化してテキストマイニングを行い、マーケティングやサービス改善に利用したり、テキストをAIで自動要約したりすることは数年前から行われている。

 ageetは通録の内容を「イメージ」に要約する実験を行った。

 筆者は「面白いことを考えるなあ」と感心した。通話内容がテキストに要約されても、「文字を追う」には時間がかかる。しかし画像なら、見た瞬間に「何についての会話か」理解できる。その仕組みが図2だ。

図2 通話録音を「イメージ」に要約する“Speech to Image”の仕組み

Copyright © ITmedia, Inc. All Rights Reserved.

スポンサーからのお知らせPR

注目のテーマ

Microsoft & Windows最前線2025
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。