「大規模言語モデル」と「画像の類似性判定」を使った場所特定技術をNECが開発:住民の安否情報から特定も可能
NECは、大規模言語モデルと画像分析によって被災状況を把握する技術を開発した。被災現場の膨大な画像から被災状況の把握に必要な画像を絞り込み、被災場所を番地レベルの正確さで素早く把握できる。
NECは2023年8月25日、大規模言語モデル(LLM:Large Language Model)と画像分析によって被災状況を把握する技術を開発したと発表した。被災現場の膨大な画像から被災状況の把握に必要な画像を絞り込み、被災場所を“番地レベル”の正確さで素早く把握できるという。
災害によって一部倒壊した建物画像からでも特定が可能
災害などの緊急時には各所からさまざまな情報(テキスト、画像)が提供される。関係省庁が公開している降水量分布や震度分布、住民から寄せられる被害や安否に関するテキスト情報などだ。しかし、それらの全てに詳細な被災の状況や場所の情報が十分に含まれているとは限らない。だが、テキストや画像から現場の位置情報を特定できれば、被災者の避難誘導や救助活動などに役立つ。
NECが開発した技術はそういった用途を目的としている。LLMによる言葉の意味解釈と画像分析による画像の類似性判定を活用することで、フリーワードと類似画像から目的の画像を検索できる。
従来も「画像を使った検索」はできたが、あらかじめ学習した対象物しか認識できず、絞り込める画像が限られていた。そのため、「災害の種類、規模や被災地域、事態の進行状況によって多様化する利用者の意図に合わせた的確な調査が難しかった」という。
現場画像から道路や建物、信号機などの領域を自動抽出し、地図のレイアウト情報(道路や建物などの形状や配置)と照合することで場所を推定。地震の際は建物よりも損壊リスクの低い道路の情報を積極的に用い、水害の際は道路よりも冠水リスクの低い建物の情報を用いて照合することで建物の一部倒壊や道路の一部浸水がある現場画像でも「高精度に撮影場所を推定できる」という。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- LLM、Platform Engineeringなど、VMwareの年次カンファレンスでの重要発表をまとめた
VMwareが年次カンファレンス「VMware Explore 2023」で多数の発表を行った。その中には「LLM」「Platform Engineering」「エッジ」などのキーワードが散りばめられていた。主要な発表をまとめた。 - 「GPT-4」は結局、アプリケーション開発にどう役立つのか
OpenAIが開発したChatGPTの進化が進む中、一部では「IT業界の未来」と指摘する人もいる。次世代の大規模言語モデルである「GPT-4」はアプリケーション開発、ITエンジニアの働き方をどう変えるのか。 - 大規模言語モデルの「創発的」能力(Emergent Abilities of Large Language Models)とは?
用語「創発」について説明。大規模言語モデルの計算量やパラメーター数が非常に大きくなると、“あるところ”を境に、突然、新しい能力を獲得して性能が大きく向上する現象を指す。