ヒトの分身を生み出す“EQ”重視の「TwinLLM」とは何か――AIが人間の価値と可能性を拡げる未来:人間の技術進化を支える生成AI/LLM
ChatGPTの登場以降、多くの企業で「生成AI」を新たなビジネスチャンスや働き方改革に活用する動きが活発化している。その中でも代表的な技術となる「LLM(大規模言語モデル)」の分野で今、注目を集めているのが2023年3月に創業したばかりの気鋭のAIスタートアップ、Spiral.AIだ。同社はなぜ誕生し、この先どこを目指しているのか。同社 代表取締役の佐々木雄一氏に伺った。
生成AIの活用が個人だけでなく、企業においても大きく注目されている。中でも、LLM関連サービスの加速度的な増加と技術発展はもはや言うまでもないだろう。今回紹介するAIスタートアップ、Spiral.AIもプロンプトエンジニアリングに強みを持ち、LLMを活用したAIキャラクターやコミュニケーションプラットフォームのみならず、自社独自のLLM開発で世界に挑もうとしている一社だ。
IQではなく「EQ」重視のAI――GAFAMが参入しない領域で戦う
LLM開発を事業の中心に据え、ユーザーに寄り添う人間主体のサービスを提供するSpiral.AI。同社は人間の技術進化を支えるLLMの構築とその社会実装を進めている。「Spiral.AIは、ひと言で言えば生成AI、特に言語モデルの会社です」と話すのは、Spiral.AIで代表取締役を務める佐々木雄一氏だ。
佐々木氏がSpiral.AIを起業したきっかけは、「ChatGPT」が登場する半年ほど前にさかのぼる。既に米国では、「GPT-3」を活用するユースケースやアプリケーションが登場していた。新しい生成AIを目の当たりにして、佐々木氏はそれらが“かなり革新的”と感じたという。
ChatGPTは欧米ではかなり盛り上がっていたが、日本はその波に全く乗れていなかった。そもそもGPT-3は英語コンテンツを生成するには優秀だが、日本語はいまひとつだった。このままでは米国に大きく遅れてしまう。「他のプレイヤーに期待しようとも思いましたが、やはり自分で取り組もうと心に決めました」と佐々木氏は振り返る。
もう1つ、自ら取り組もうと考えたのは、先行するOpenAIやGAFAM(Google、Amazon.com、Facebook《現Meta》、Apple、Microsoft)と渡り合う確かな戦略があったからだ。GAFAMは、膨大なデータを学習して汎用(はんよう)的で正確性が高いLLMを求めている。「GAFAMのようなベンダーは、完璧な生成AIを作るのが“宿命”となっています」(佐々木氏)
GAFAMが参入できないのは、正確性よりも“人間らしさ”を重視する生成AIだ。「この人間性を追求する領域に、“宿命”を持つGAFAMは参入できません」と佐々木氏。つまり、より高い正確性を追求するIQ(Intelligence Quotient)路線ではなく、感覚知能である「EQ(Emotional Intelligence Quotient)」路線を追求するのがSpiral.AIだ。そのため、Spiral.AIは、ビジョンとして「人間らしさに技術の力で挑戦する」ことを掲げている。
正論より感情? 声で自然に会話できる「TwinLLM」とは
Spiral.AIの特長としてユニークなのは、前述の通りEQを追求している点だ。
Spiral.AIの人間性を追求するAIは、漫画やアニメ、映画に出てくるような“人に寄り添うAI”。いわば友達のような存在だ。「常に正論を述べる人より、こちらの心情や考えに寄り添った意見や物言いをしてくれる感情豊かな人の方が、友達としてはふさわしいでしょう」(佐々木氏)
一方、OpenAIなどが追求するAIは、質問すれば膨大な学習データから常に正確性が高い、マジョリティーな答えを返すだろう。「それでは会話していても息が詰まるでしょう。AIは、もっと気軽に付き合えるものであるべきです」と佐々木氏は力を込める。
Spiral.AIでは、人間らしいAIを実現するためにLLMの研究開発に取り組み、それを事業としている。その一つが、AIキャラクター事業として最初のサービスとなる「Naomi.AI」だ。これは音声とチャットで、実在する芸能人「真島なおみ」さんとの会話を体験できるものだ。真島なおみさんの声に加えて、発言する内容やリアクション、口調などもご本人のキャラクター性を再現している。数十時間の会話から収録した音声データを学習してキャラクターを構築している。
同様の学習で、他のキャラクターも再現できる。AIで構築したキャラクターをSpiral.AIでは「Twin」と呼ぶ。そして「Twin Room」という形で、さまざまなキャラクターを再現してコミュニケーションできるようにすることを考えている。
Twinのキャラクターは、チャットbotとしての利用はもちろん、ソーシャルツールなどと連携させることも可能だ。多彩なキャラクターを持ったインタラクティブ性のあるユーザーインタフェースを、さまざまなサービスに実装できる。「声も再現できるので、構築したTwinを『YouTube』に出演させて対話するライブ配信も可能です」と佐々木氏は自信をのぞかせる。
コミュニケーションのインタフェースとして、テキストだけでなく音声の入出力が用意されているのは大きい。「声があると、よりその人のキャラクター性が際立ちます。極めて自然なコミュニケーションができるのです」(佐々木氏)
LLMへの入力時に、キーボードを使って文章を打ち込んで回答を待つことは、実際にやってみると面倒に感じることも多い。人とのコミュニケーションは、もっと気軽に話し掛けて始まるものだ。そのため、より人間らしいAIを実現するには、「LLMと音声入出力をセットにすることが重要です」と佐々木氏は話す。
先駆的な独自LLMの開発を支えるファインチューニング技術
Spiral.AIは企業向け独自LLMの開発にかなり先駆的に取り組んでいる。現状、汎用的なLLMを構築できるのは、大規模な投資ができるOpenAI(Microsoft)やGoogleなど、一部のビッグ・テックに限られる。一般の企業などは、このビッグ・テックから提供される汎用LLMを利用し、企業独自の業務データなどを取り込み、自社向け生成AIを構築する。しかし、独自データをLLMに取り込むのは、「実はかなり難しい」と佐々木氏は指摘する。
LLMの開発ではまず、最もコストがかかるベースモデル構築のフェーズがある。次に、独自の知識を埋め込むファインチューニングのフェーズがあり、さらに多様なニーズに合わせる強化学習のフェーズがある。いずれも先端的な研究領域であり、昨日の常識が今日書き換わってしまうような、激しい速度で進歩している。
Spiral.AIは、ファインチューニングの技術に強みを持つ。その上で、より企業独自の業務やデータの特性、ニーズに最適化するための強化学習まで実施する。「生成AIをビジネスとしている企業でも、ここまでこだわっているところは珍しいのではないでしょうか」(佐々木氏)
LLMの社会実装を目指し、GPUリソースに積極投資して8TFLOPS以上の計算能力を確保
Spiral.AIでは、開発したLLMを公開するだけでなく、ホスティングサービスとして企業が利用できる形でも提供を検討している。「OpenAIがここまで利用者を獲得できたのは、ホスティングまで一貫して行い、開発時の工数を最小化できたからです。われわれもサービス提供の際にはそこまで持っていきたい」(佐々木氏)
こうしたLLMの研究開発、そしてサービス提供に必要なインフラとして、Spiral.AIはGPUリソースに積極的に投資している。GPUはクラウドではなく、自社専用マシンを調達してデータセンターにオンプレミスで構築した。「LLMの開発には、GPUを駆使した膨大な計算量と速度が必要になります。そのためには、大量のGPUをクラスタリングしたスパコン級の計算基盤が必要です」(佐々木氏)
Spiral.AIでは、NVIDIAのGPUを採用して8TFLOPS以上の計算能力を確保し、今後さらにGPUクラスタの規模を拡張、増強していくようだ。このGPUクラスタの設計、構築を手掛けるのが、NVIDIAのエリートパートナーであるNTTPCコミュニケーションズ(以下、NTTPC)だ。
LLMの開発には、演算性能の高いハイエンドGPUを用意することはもちろん、各GPUがダイレクトに通信して協調動作させるために、高速インターコネクトでマルチGPU・マルチノード間を接続する必要があり、ネットワーキング技術が非常に重要だ。NTTPCは、生成AIの登場をきっかけに需要が増しているGPUクラスタの設計・構築に関する技術的知見を持ち、有数のAI企業や研究機関へ提供している。
「クラスタということで、GPU以外に考慮すべき重要なポイントがネットワーク設計と設置環境でした。ラック間の接続や温度管理、電力設計など条件がシビアなので、データセンターまで含めて一括してお任せできたことがNTTPCさんをパートナーに選んだ決め手です」(佐々木氏)
世界の偉人から自分の双子=Twinまで。AIが人間の進化を支える未来へ。
LLMの今後について、佐々木氏は「一人一人の人格を模倣した言語モデルが、構築できるようになるでしょう」と展望する。それが可能になれば、自分の分身も実現できる。
「今は1人の人間だと8時間しか働けませんが、もし自分の双子=Twinが作れれば、自分が寝ている間も分身が対応して、分担しながら効率的に働けるようになるでしょう」(佐々木氏)
そして、「究極的には、アインシュタインのような偉人の脳、キャラクターを再現し、その分身とブレインストーミングをしてみたい」と佐々木氏は話す。既にSpiral.AIでは、亡くなった文化人のキャラクターを再現し、チャットや音声でコミュニケーションできるようにする取り組みも始めている。かなり高精度でその人のキャラクターは再現されており、リアリティーのあるコミュニケーションが可能となっている。
「将来的には人類の中の賢い人の頭脳を、容易に借りられる世界を実現したいです。それが人間をより進化させるでしょう」と佐々木氏。前述のGAFAMのように、AIに正確性を求める欧米ではAIについて規制を設ける動きが活発化しているが、その根底にあるのは「AIは人間を滅ぼす」という懸念だ。一方、佐々木氏は「AIは人間を進化させるもの」と捉えており、そこがSpiral.AIの大きな強みになっているといえる。
誰でも気軽に「専門家」「天才」と呼ばれる人の頭脳を借りて、ブレインストーミングしたり、アドバイスをもらったりできる。そのような未来が、すぐそこまで来ているのかもしれない。
Copyright © ITmedia, Inc. All Rights Reserved.
関連リンク
提供:株式会社エヌ・ティ・ティピー・シーコミュニケーションズ
アイティメディア営業企画/制作:@IT 編集部/掲載内容有効期限:2024年3月22日