検索
連載

国家資格にも登場? 「データマネジメント」が、生成AI活用の成否を分かつ理由生成AI活用の成否を分かつ「データマネジメント」超入門(1)

企業における生成AIの活用が加速する一方、蓄積したデータをAI自身に理解させなければAI活用の取り組みは頓挫しかねない――そこで本連載は、AI活用の成否を分ける「データマネジメント」に焦点を当てる。初回は、なぜデータマネジメントがAI活用の成否を分けるのか、AIがデータを正しく理解するために求められる取り組みを整理する。

PC用表示 関連情報
Share
Tweet
LINE
Hatena

 現在、生成AI(人工知能)やAgentic AI(エージェンティックAI)の登場により、AIとデータを組み合わせた業務変革やビジネスの付加価値創出への期待は飛躍的に高まっている。だが、PwCコンサルティングの調査(「生成AIに関する実態調査2024 春 米国との比較」)によると、生成AIの活用、推進率は米国が91%であるのに対し、日本は67%にとどまっている。より深刻なのは、AI活用から「期待以上の活用効果」が出ている企業の割合だ。米国が33%であるのに対し、日本はわずか9%に過ぎないことだ。

 この期待と現実の大きなギャップは、技術の進化に対して、それを生かす仕組み(非技術領域)が追い付いていないことに起因すると筆者は考える。事実、AIプロジェクトの失敗要因に関する同調査の分析では、活用効果が期待未満の企業のうち、30%が失敗の第1位の理由として「データ品質の問題」を挙げている。また、「データの意味・定義の不明確さ」も主要な失敗要因の一つとなっており、AIだけでなくデータ活用の在り方や考え方も変えていく必要がある。

 国もデジタル人材育成を議論する中で、生成AIの活用に注目が集まる一方、多くの企業にデータマネジメントのノウハウが不足していることを危惧している状況だ。経済産業省が公開している資料によれば、こうした背景を受け、既存のエンジニアリング領域の国家試験にデータマネジメントを問う問題を追加したり、データマネジメントに関する新たな試験を設立したりするなど、データマネジメントのスキルを国レベルで向上させる検討、議論を進めている状況にある。

 そこで本連載は、AI時代に不可欠となる「データマネジメント」、特に「ビジネスメタデータ」の必要性と整備、活用に向けた具体的なアプローチを解説していく。初回となる今回は、なぜデータマネジメントが生成AI活用の成否につながるのか、その背景やビジネスメタデータの必要性を整理する。

AI時代に直面する「意味不明」の危機

 なぜ、データがあってもAIが誤解し、ビジネスで活用できないのか。その問題は、長年にわたり企業に根付いてきたデータ管理の構造に起因している。

 データ活用がうまくいかない背景には、データが「そのデータの意味を知る人にしか使われない」という現状がある。製造業の現場を例に取ると、「120.5」という数値データを見たとき、熟練の担当者であれば、それが「スピンドル温度(℃)」を示していることを暗黙知によって瞬時に判断できる。

 従来は、データ記録者と受領者が暗黙知で理解し合ってきたため、データの論理的な情報が不足していても、問題になることはなかった。しかし、少子高齢化や世代交代が進む中で、暗黙知の継承は困難になっている。

 データに「意味」が伴わない場合、データ記録者と受領者以外は何を意味するのか理解することができない。「120.5」とは、「スピンドル温度」なのか、それとも「シャフト径(mm)」を示しているのか、当事者以外は分からない。もしもそれが「スピンドル温度」だと理解できたとしても、それが正常値なのか異常値なのかも判断できない。

暗黙知の継承は困難になりつつある
暗黙知の継承は困難になりつつある

 このような状況は、AI活用においても致命的だ。もしAIエージェントに何の文脈もなく「120.5」を与えて判断させようとしても、そのデータが「何であり、何を意味し、どう使われるべきか」というビジネスコンテキストが欠けていれば、AIは正しく学習も判断も実行もできないし、場合によってはハルシネーション(幻覚)を引き起こす原因となってしまうだろう。

日本企業を阻む「2種類のサイロ」の壁

 データの意味が組織で共有されない背景には、日本企業に根深い二重の構造的課題がある。

 一つは従来の「メタデータのサイロ」である。多くの日本企業は、部門ごとに業務システムが個別に構築されてきたため、データの全社的な標準化が進んでいない。eコマース(電子商取引)を例にしてみると、EC事業部門、CX(カスタマーエクスペリエンス)部門、実店舗事業部門がそれぞれ保有する「会員データ」は、同じ名称でも部門ごとに重要とされるデータの種類や内容、期待される使途が異なる場合がある。

 これにより、データの内容を誰もが理解できるように可視化、共有するためのメタデータが部門間に分断され、企業全体での連携が阻害されてしまう。

 そしてもう一つ、AI時代の急速な技術進化によって生まれたのが「ナレッジのサイロ」だ。データサイエンティストやデータエンジニアといった技術の専門家は「分析手法」には精通しているが、データが生成された業務やビジネスの背景にあるナレッジ(知識)が不足しているケースがある。

 結果として、ビジネス目的を持つ人と、アナリティクス技術や元データのナレッジを持つ人との間で構造的な隔たりが生じ、データがビジネスに実効性を持って活用されないまま「宝の持ち腐れ」になっている状況が見受けられる。

ビジネスメタデータがデータに「意味」を与える

 こうした危機を乗り越え、データ活用のボトルネックを解消する鍵こそが、データマネジメントの中核を成す、メタデータの戦略的活用だ。

 メタデータとは、「データを説明するデータ」を指す。実データそのものは、例えて言うなら石油の「原油」や鉱石の「原石」のような資源(原材料)に過ぎず、そのままでは使い道や効果が限定的だ。

 このデータという資源に、メタデータを付加して情報化することで、人やAIがビジネス価値の高い分析、判断、作業を可能にする「資産」へと変換される。

 メタデータは大きく分けて3つに分類できる。

  1. テクニカルメタデータ:システムに存在する情報(物理名、データ型、データ長など)。主にシステム開発者向けのデータとなる
  2. オペレーショナルメタデータ:データの流れや状態に関する情報(活用率、リネージなど)。主にデータマネジメント組織向けのデータとなる
  3. ビジネスメタデータ:データ活用に必要なナレッジ(論理名、ドメイン分類、概要など)。ビジネス部門向けのデータとなる。

ビジネスメタデータの定義と3つの役割

 AI時代において最も重要なのが、データの意味やビジネス的な文脈を定義し、全社で共通理解を可能にするビジネスメタデータとなる。これは、単なるデータやテクニカルメタデータの組み合わせでは理解できないビジネスコンテキスト(背景、意味、使い方、制約など)を補完し、データにビジネス的な価値を持たせるために必要だ。

 ビジネスメタデータは、組織内で以下のような役割を果たす。

  • 翻訳者(Translator):データの業務的意味を明確化し、部門間やシステム間の認識齟齬(そご)を防ぐ
  • 案内人(Navigator):業務に必要なデータへの道筋を提供し、データの探索にかかる時間を削減する
  • 品質管理者(Quality Manager):データの信頼性を保証し、誤った解釈や不適切な使用を防止する
ビジネスメタデータのイメージ
ビジネスメタデータのイメージ

ビジネスメタデータの有無がAIの「理解力」を分ける

 ビジネスメタデータがAIの活用効果を決定づけることは、RAG(Retrieval-Augmented Generation:検索拡張生成)といった生成AI技術を用いた検証でも顕著に示されている。

 例えば生成AIに「直近6カ月の売り上げ減少の主な原因は何で、どのような対策が効果的か分析してください」というプロンプトを投入した場合、ビジネスメタデータの有無により以下のような違いが見られる。

  • ビジネスメタデータなしのRAG:実データとテクニカルメタデータのみを提供した場合、AIは提供されていないテーブル情報のため実データを認識できないにもかかわらず、勝手にワードを作成して回答したり、分析に必要な情報を回答できなかったり、追加質問をしてもビジネスに役立つ回答を返せない状況に陥る
  • ビジネスメタデータありのRAG:実データ、テクニカルメタデータに加えビジネスメタデータを提供した場合、AIはデータの内容を正しく理解し、分析の根幹となる指標を特定できる。さらに、データ管理者や利用に関する注意点、生成背景といった付帯的な情報まで提供でき、アクセス権限の質問に対しても正確な回答を加えて返す
ビジネスメタデータの有無が生成AIの回答精度にもたらす違い
ビジネスメタデータの有無が生成AIの回答精度にもたらす違い

 これは、ビジネスメタデータがAIに対して「データの意味、由来、関連性」といったビジネス文脈を与えた結果であり、AI活用を実効性の高いものにするためには不可欠といえる。

メタデータマネジメントが企業の競争力を左右する

 データマネジメント、特にビジネスメタデータマネジメントへの取り組みは、単なるIT施策や技術的な裏方業務ではなく、AI時代を勝ち抜くための企業の競争力を左右する経営戦略として位置付けられるべきだ。

 ビジネスメタデータが整備されていることは、以下のような具体的なメリットと高い投資対効果をもたらす。

  • AI/DX(デジタルトランスフォーメーション)プロジェクトの成功率向上:メタデータ整備済み企業は未整備企業と比較してAI/DXプロジェクト成功率が3倍高いという報告もある。データの意味が明確になるため、AIモデルの学習効率と精度が向上するためだ
  • 意思決定の高速化とリスク軽減:データ発見時間が60%短縮された例もあり、それは結果として、経営判断の意思決定の高速化につながる。誤ったデータ解釈による判断ミスが減り、リスクが軽減される
  • 組織知の形式知化と生産性向上:熟練者の暗黙知が形式知化され、異動により着任した社員の研修期間が短縮されるなど、属人的な知識に依存しない組織運営が可能になる。eコマースの現場では、購買履歴データに「購入目的:自己消費/ギフト」「購入パターン:定期購入/単発購入」といったビジネスメタデータを付与、活用することで、レコメンデーション精度が向上し、CVR(コンバージョン率)も改善するといったことも考えられる

遅きに失しないために

 データの活用を目指す企業にとって、今、ビジネスメタデータの整備に着手することは喫緊の課題となっている。その理由は、実データ量(IoT〈Internet of Things〉センサー、画像・動画データ、ERP〈Enterprise Resource Planning〉データなど)がAI活用によって指数関数的に増加する一方で、ビジネスメタデータ整備は線形的にしか進まないという時間差のギャップが存在するためだ。

 この時間差を放置し後回しにすると、時間がたつほどに「意味不明」で「使われないデータ」が組織内に蓄積され、結果として取り返しがつかなくなる。

 あらためて企業は、データが「ヒト」「モノ」「カネ」に次ぐ第4の経営資源であると強く認識すべきだ。他の経営資源と同様に、データそのものの意味、構造、品質について定期的に現状を把握し、改善を図る必要がある。ビジネスメタデータマネジメントは、部門横断的な取り組みが不可欠であり、現場の従業員やIT部門だけでなく、経営層が強いコミットメントを持ってけん引することが成功の要件となる。

 データの「意味」を定義・共有できる仕組み、すなわちデータインテリジェンスの構築こそが、AI革命の時代を勝ち抜き、持続的に価値を創造し難題を解決できる未来を実現するための羅針盤となる。

 次回は、ビジネスメタデータの具体的な「見つけ方」や「進め方」といった実践的なアプローチを、深く掘り下げる。

筆者紹介

阿部恵史

外資系IT企業を中心に様々な技術・マーケティング職を経験。また、ガートナーのアナリストとしてDevOps、SRE、AIOps、RPA分野などの市場動向分析、CTO/CIOへの提言を行う。20年以上にわたり、メディア寄稿記事の執筆や、ガートナー主催イベントでの基調講演を始め、多くのカンファレンス/イベントでの講演経験あり。

2024年7月よりQuollio Technologiesにてマーケティングを統括。


Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る