SageMaker Studioはビジュアルコンソールで、機械学習におけるさまざまな機能をカバーする後述のツール群を統合している。ビジュアルインタフェースでは、これらのツールの動きを俯瞰し、このインタフェースを去ることなく各ツールを利用できるようになっている。
SageMaker Studioは、ソフトウェア開発におけるCI/CD(継続的インテグレーション/継続的デリバリー)開発プラットフォームとその上で動作するツール群を、機械学習用に再現したものともいえる。開発者が、機械学習をソフトウェア開発に似たワークフローとして、自動化を加えながら進めることができ、イテレーション(反復開発)のサイクルを、高い生産性で実行できるようにすることを狙っている。
「ノートブック、試作管理、自動のモデル作成、デバッグ、プロファイリング、モデルの変動検出など、全ての機械学習開発手順は SageMaker Studio のビジュアルインタフェースで実行できる」とAWSは主張している。
今回のカンファレンスで、AWSが発表したSageMaker Studio関連のツール群は次の通り。
ホスト型のJupyter Notebook。仮想インスタンスを意識せずに、SaaS的な使い方ができる。ノートブックを共有するリンクを、ワンクリックで生成できる。
上述の、機械学習モデルを自動的に生成するツール。データを複数のアルゴリズムおよびハイパーバラメーターで自動的にトレーニングしてモデルを構築、ランク付けを行う。SageMaker Autopilot で生成したモデルは、SageMaker Studioのビジュアルインタフェース上で、最大50種類まで試せるという。
トレーニング、データ処理、モデル評価といった機械学習のジョブを追跡・管理するツール。複数の関連するジョブを「実験(Experiment)」としてまとめて管理できる。入力パラメーター、構成、結果といった、各ジョブの入力/出力がログとして自動的に保存される。繰り返し処理でこれを活用し、時間や労力を節約できる。
トレーニング中における問題を分析し、デバッグするツール。学習勾配をはじめとするメトリクスを、トレーニング中にリアルタイムで自動的に取得する。こうしたメトリクスは、SageMaker Studioのビジュアルインタフェースで見ることができる。一般的な問題については、警告を発することができるという。
機械学習モデルのデプロイ後に、その精度をモニタリングするツール。モデルのトレーニングで利用したデータの前提条件が変わることで、モデルの精度が影響を受ける「コンセプトドリフト」を監視する
SageMaker Studio関連ツールには含まれていないようだが、これはPython SDKを通じ、(scikit-learnの利用で)データの前処理、後処理、モデル評価といった作業の煩雑さを軽減するもの。
ミニック氏は、「機械学習/AIという分野は、まだ初期段階にある。次々に新しいアルゴリズムやライブラリが登場するなど、急速な進化が続いている。データサイエンティストや機械学習エンジニアが、これに振り回されることなく、逆に新たな進化をツールとして取り込み、仕事の質や生産性を高められる環境が必要だ」といい、AWSはSageMaker Studioを、こうした環境として送り出したのだとしている。
Copyright © ITmedia, Inc. All Rights Reserved.