AIと生成AIの出現に伴い、データを巡る議論は新たな段階に入った。データとアナリティクス(D&A)のリーダーは、自社のデータがAI-Readyであることを証明し、AI-Readyなデータの需要に対応できるようにする必要がある。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
データ戦略は常に重要だ。だが、AIと生成AIの出現に伴い、データを巡る議論は新たな段階に入っている。Gartnerの調査によると、自社のデータは「AI-Ready」だと回答した企業は4%にすぎない。逆に言えば、自社のデータをAIに対応させて活用する準備ができていない企業が96%に上ることになる。
AIと従来のデータ管理におけるデータ要件の大きな違いを認識していない企業は、AIへの取り組みが失敗する恐れがある。データとアナリティクス(D&A)のリーダーは、自社のデータがAI-Readyであることを証明し、AI-Readyなデータの需要に効果的に対応できる必要がある。
AI-Readyなデータは、特定のユースケースを代表するデータでなければならない。特定用途向けのAIモデルのトレーニングまたは実行に必要な全てのパターン、エラー、外れ値、予期せぬアウトプットを含んでいる必要がある。データをAI-Readyにすることは、1回限りの作業ではなく、全てのデータについて事前に準備ができることでもない。継続的なプロセスと実践であり、データの適合性や適格性、ガバナンスを確保するためのメタデータが利用可能であることが前提となる。
データがAI-Readyであることを証明するには、D&AチームとAIチームは、パイロットプロジェクトを迅速に反復、統合し、AIユースケースの本格的な開発と運用における使用に適したデータを特定できる必要がある。D&Aリーダーは以下の推奨事項に取り組み、データをAI-Readyにする必要がある。
AIユースケースについては、どんなデータが必要かを必ず記述する必要がある。それは、使用されるAI手法によって決まってくる。これは前もって完全に定義することはできないかもしれないが、データが使用され、AI要件が満たされるにつれて明らかになる。D&Aリーダーは、データが以下のパラメーターに関して、AIユースケースで求められる要件を満たすようにする必要がある。
データの適格な使用により、データが運用されるモデルのトレーニング用、開発用、実行用のいずれであるかにかかわらず、継続的に要件を満たすことが保証される。以下のパラメーターを用いて、AIユースケースで求められる信頼要件にデータを対応させる必要がある。
D&Aリーダーは以下のパラメーターを用いて、データがAIユースケースをサポートするために満たすべき継続的なデータガバナンス要件を定義する必要がある。
データ管理は永遠に続く課題だ。これらのポイントを押さえてデータをAI-Readyにするのは、1回限りのプロセスではなく、継続的な取り組みであることを念頭に置く必要がある。
出典:How to Ensure Your Data Is AI-Ready(Gartner)
※この記事は、2024年6月に執筆されたものです。
Copyright © ITmedia, Inc. All Rights Reserved.