Amazon Web Services(AWS)が2019年12月第1週に開催した「AWS re:Invent 2019」における、機械学習/AI関連の発表に共通するテーマをまとめると、「開発者/データサイエンティストが、まだ初期段階にある機械学習/AIの活用で、高い生産性を発揮し続けるのを支援する」ということだという。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
Amazon Web Services(AWS)が2019年12月第1週に開催した「AWS re:Invent 2019」における、機械学習/AI関連の発表に共通するテーマをまとめて一文で表現すると、「開発者/データサイエンティストが、まだ初期段階にある機械学習/AIの活用で、高い生産性を発揮し続けるのを支援する」ということだという。
例えば今回のカンファレンスでAWSが発表した機械学習関連機能に、「Amazon SageMaker Autopilot」がある。これは「AutoML」と総称される機械学習自動実行ツールの一つで、入力されたデータに前処理を加えた後、アルゴリズムおよびハイパーパラメーターをさまざまに変えて次々にトレーニングと評価を実行し、結果を逐次示す。
Autopilotが提供する機能は、例えばData Robotと似ているようにも見える。だが、Data Robotが「AIの民主化」をうたい、エンジニアでない人でも使えるサービスにしようといるのとは指向性が異なる。
AWSのAIプロダクトマーケティングで主席を務めるジョエル・ミニック(Joel Minnick)氏によると、「Autopilotは、ブラックボックスでないことが重要な特徴」という。ユーザーは評価パラメーターに基づいて最適なモデルを選択するだけでなく、自動で実行された処理の内容を詳しく見ることができ、選択したモデルにさらなる改善を加えられる。また、処理内容からの知見を、他の機械学習プロジェクトに生かすことができる。
後掲の「Amazon SageMaker Experiments」では、Autopilotおよびそれ以外の機械学習ジョブを管理できる。データ処理、トレーニング、モデル評価にわたるジョブの構成や結果をログとして捕捉、関連する複数のジョブを「Experiment(実験)」としてまとめて管理した上で、精査、比較、再現、改善などができるようになっている。
ミニック氏は次のように説明する。
「データサイエンティストは、AutoMLツールに関して改善の余地が大きいと考えてきた。なぜ特定のモデルを選択するのかが十分説明されない。さらに問題なのは、再現が難しいということにある。例えば、次回に同様なデータセットをサービスへ入力すると、同じモデルが構築されるのかは分からない」
「データサイエンティストは単一のモデルを求めているのではない。トレードオフがよく分かるような形で複数のモデルを提示し、これらの選択肢からユーザーが選べるようなツールを求めている。同じように重要なのは、自動構築ツールが何を行ったかをノートブック上で理解し、モデルを再現できるようにすることだ。これにより、後で再トレーニングを実行するなどし、モデルを進化させられる」
ミニック氏は、より抽象度の高いAWSの機械学習/AIサービス、例えばAmazonのリコメンデーションエンジンと同様な機能が使える予測サービスの「Amazon Personalize」などでもこれは同様で、モデルの中身を理解できることが重要な特徴だと話す。
AWS re:Invent 2019では、煩雑な側面のある機械学習プロセスを、一般的なソフトウェア開発に似た環境で実行し、生産性を高められるツール群を発表した。これを象徴するのが「機械学習分野における初の統合開発環境(IDE)」という「Amazon SageMaker Studio」だ。
「AWSは、『あらゆる開発者の手に機械学習の力をもたらす』ということをテーマとして、機械学習サービスを展開してきた。今回のカンファレンスでは特に、機械学習に取り組む際の障壁をどう低減するか、そしてデータサイエンティストおよび機械学習エンジニアが、可能な限りスピードと生産性を高める手助けをするにはどうすべきかがテーマだった。モデルの構築における質と効率、円滑さを向上するSageMaker Studioは、この意味で、素晴らしい例だといえる」(ミニック氏)
Copyright © ITmedia, Inc. All Rights Reserved.