生成系AIが注目を集める中、従来の画像認識や音声認識のAIも依然として非常に有用です。この記事では、誰でも手軽にできる疑似体験を通じて、会議時の音声を文字起こしをする「議事録AI」の作成を試みます。一緒にAIの世界へ一歩踏み出しましょう!
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
ChatGPTや画像を自動で作り出すAI(人工知能)など、いわゆる生成系AIのニュースが毎日のように流れていますね。2023年の春ごろと比べると、生成系AIの大流行はやや落ち着いてきたように感じますが、それでも「新しいAIのブーム」は始まったばかりだと筆者は考えています。
現在の大ブームの1世代前、具体的には2012年〜2022年までの10年間は、さまざまなAIが流行していました(「第3次AIブーム」と呼ばれています)。動物の写真から猫を見分けるAI(画像認識AI)、音声による「今日の天気は?」といった指示を理解するスマートスピーカー(音声認識AI)、映画の感想コメントが肯定的か否定的かの感情を判別するAI(テキストの感情識別AI)などが特にIT業界とビジネス界で注目されました。本連載ではこれらのAIを識別系AIと呼称して、生成系AIと大まかに区別しています(本連載の第1回で詳しく説明しています)。
新しい生成系AIの大ブームの陰で、従来の識別系AIがもはや忘れられかけているかもしれませんね(笑)。でも、従来のAIも依然として非常に役立ちます。例えばキュウリの等級(長さ、太さ、曲がり具合、色など)を自動選別するAIカメラなどといった画像認識AIは、これからも新規に開発されていくでしょう。生成系AIはこのような目的には向いていませんからね。ですので、AIの世界に触れるなら、1世代前の識別系AIにもぜひ触れて体験してみてください。それが、AIを適切に使いこなすための一歩になるでしょう。
ということで今回は「識別系AI」に焦点を当て、特にこれまで「AIは難しそう」「自分の仕事とは関係ない」と感じていた人に向け、気軽な疑似体験を通して識別系AIの魅力をお伝えします。識別系AIには多種多様な用途が考えられますが、一般的なビジネスシーンで直接役立つ“会議の音声を認識して自動的にテキストにする「議事録AI」”を手軽に作ってみようと思います。ここで使用するのは最先端の音声認識モデル「Whisper」で、高い精度と使いやすさが魅力です。具体的には図1のような識別系AIの作成を体験します。
さっそく「議事録AIを作ってみよう」と進めたいところですが、その前に「AIを作ることには何段階かの難易度レベルが考えられ、簡単に作るためのツールもあるよ」という、知っておくと役立つ前提知識を示しておこうと思います。
この連載では、人工知能(AI)やデータ分析/データサイエンスをこれまでに学んだことがない社会人(新卒の社会人1年生からベテラン社員まで大歓迎!)に向けて、「データ&AIを活用したいなら、最初に知っておくべき全体概要」、具体的にはAI・データサイエンスの概要と、データ分析(数値予測などの分析系AI)、画像認識などの識別系AI、文章生成などの生成系AIを紹介します。
難しい知識の習得よりもシンプルな経験を重視して、手を動かして体験しながら学べる内容ですので、肩の力を抜いてぜひとも気楽に読み進めてください。
本連載は、AI関連の専門知識がない社会人をメインターゲットとしています。知識がゼロでも、今の時代にはAIを作ったり使ったりできます。専門知識を駆使して作るAIから、知識ゼロで使うAIまで、AIを作る/使う際の難易度レベルについて、特に1世代前の「識別系AI」に焦点を当てて説明します。本稿では、識別系AIを作る/使う際の難易度レベルを、簡単〜難しい順に下記の5段階に分けました(図2)。
Copyright© Digital Advantage Corp. All Rights Reserved.