IBMとNASA、地理空間AI基盤モデルをHugging Faceで公開:気候科学、地球科学のイノベーションを支援するオープンデータセットも
IBMとHugging Faceは地球観測データに基づくAI基盤モデルをHugging Faceで公開した。
IBMとHugging Faceは2023年8月3日(米国時間)、NASAの衛星データから構築された地理空間AI(人工知能)基盤モデルを、Hugging Face上で公開したと共同発表した。
環境条件が毎日のように変化する気候科学において、最新データへのアクセスは重要な課題だ。NASAの推定によると、2024年までに科学者は25万テラバイトのデータを入手することになるが、データ総量が増えているのにもかかわらず、科学者や研究者は、これらの大規模なデータセットの分析が難しいという課題に直面している。
このモデルはIBMの基盤モデル技術を活用したもので、さまざまなタスクに使用でき、ある状況からの情報を別の状況に適用できるAIモデルを作成、訓練するIBMの大規模な取り組みの一環だ。今回の取り組みを通じて、気候科学と地球科学における新たなイノベーションを目的とした、AIへのアクセスや応用を民主化できると、IBMは述べている。
基盤モデルはどのような用途に活用できるのか
IBM基礎研究所の副所長スリラム・ラガヴァン氏は「気候変動のような重要な分野の発見を加速するために、オープンソーステクノロジーが果たす役割は、かつてないほど明確になっている。柔軟で再利用可能なAIシステムの構築を目指したIBMの基盤モデルの取り組みと、NASAの地球衛星データのリポジトリを組み合わせ、オープンソースAIのプラットフォームであるHugging Faceで提供することで、地球環境の改善に役立つ、より迅速でインパクトのあるソリューションを実装できる」と述べている。
Hugging Faceで開発部門のトップであるジェフ・ブーディエ氏は「AIは依然として科学主導の分野であり、科学は情報の共有とコラボレーションでのみ進歩できる。つまり、オープンソースのAIとモデルやオープンデータセットの公開が、AIの継続的な発展にとって非常に重要だ。オープンにすることでテクノロジーは必ず多くの人々に利益をもたらすことができる」と述べている。
NASAのサイエンスデータ部署のチーフであるケビン・マーフィー氏は「私たちは、基盤モデルが観測データの分析方法を変え、地球という私たちの星をよりよく理解するのに役立つ可能性があると信じている。そして、そのようなモデルをオープンソース化し、世界に公開することで、その影響力を倍増させたい」としている。
IBMとNASAが共同開発した基盤モデルは、1年間にわたるHLS(Harmonized Landsat Sentinel 2号)の衛星データを使って学習され、洪水や火災跡のマッピングのためにラベル付けされたデータでファインチューニングされた。ファインチューニングすることで、森林伐採の軌跡、農作物の収穫予測、温室効果ガスの検出と監視などの課題に基盤モデルを応用することができる。IBMとNASAの研究者はまた、クラーク大学と協力して、このモデルを時系列セグメンテーションや類似性研究などの用途に適応させている。
NASAは、ホワイトハウスや他の連邦政府機関とともに、2023年を「オープンサイエンス年」と定め、データ、情報、知識のオープンな共有で生み出される利益と成功を祝うとしている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 基盤モデル(Foundation Model)とは?
用語「基盤モデル」について説明。大量のラベルなしデータを使って事前学習し、その後、幅広い下流タスクに適応できるようにファインチューニングする、という2段階の訓練工程を踏んだ、1つのAI・機械学習モデルのことを指す。 - コーディング用大規模言語モデル「StarCoder」とは 何がすごいのか
AI開発向けのツールを提供しているベンチャー企業Hugging Faceは、2023年5月4日(米国時間)、コーディング用大規模言語モデル(LLM)の「StarCoder」を一般公開。ベンチマークによる評価やデータセットなども併せて公開した。 - Google、MLハードウェアとフレームワークの統合を簡素化する「PJRT」を発表
Googleは、オープンソースの機械学習(ML)コンパイラエコシステム「OpenXLA」プロジェクトの一部として、「PJRT」をオープンソースとして公開した。PJRTは、MLハードウェアやMLフレームワークに依存しないMLコンパイラインタフェースやMLランタイムインタフェースを提供する。