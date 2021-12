この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

本連載第6回では、最小限のPythonコードでAutoMLを実現するローコード機械学習ライブラリ「PyCaret」を紹介しました。今回はディープラーニングモデルを自動構築する「AutoKeras」を紹介します。

AutoKerasとは

AutoKerasは、TensorFlowまたはMicrosoft Cognitive Toolkit(CNTK)などの高レベルAPIであるKeras(現在はtf.keras〈※〉)をベースとしたAutoMLシステムで、テキサスA&M大学のData Labで開発されました。

AutoKerasの目標は、公式サイトで“The goal of AutoKeras is to make machine learning accessible to everyone.”と書かれているように、機械学習を誰もが近づきやすいものにすることです。

※現在KerasはTensorFlowに取り込まれ、以前のKerasと区別するためにtf.kerasと呼ばれることがあります。

開発元 テキサスA&M大学 Data Lab GitHub公開日 2017年11月 リポジトリー https://github.com/keras-team/autokeras 実装言語 Python ライセンス Apache-2.0 License 公式サイト https://autokeras.com/ 表1 AutoKerasの基本情報

AutoKerasは以下のような識別器クラスを備えており、画像をはじめテキストやテーブルデータなどを扱うことができます。

識別器 機能 ImageClassifier 画像の分類 ImageRegressor 画像による回帰 TextClassifer テキストの分類 TextRegressor テキストによる回帰 StructuredDataClassifier 構造化データの分類 StructuredDataRegressor 構造化データによる回帰 TimeSeriesForecaster 時系列予測 表2 AutoKerasの識別器

そして、各識別器クラスは、以下のようなメソッドを備えています。

メソッド 機能 fit() 学習 predict() 予測 evaluate() 評価 export_model() モデルのエクスポート 表3 識別器クラスのメソッド一覧

具体例は次の章で説明しますが、AutoKerasの基本的な使い方は非常に簡単で、以下のような短いコードで学習や予測ができます。

import autokeras as ak clf = ak.ImageClassifier() # 学習 clf.fit(X_train, y_train) # 予測 predictions = clf.predict(X_test)

主な特徴

AutoKerasは、AutoMLができる他のOSS(オープンソースソフトウェア)と比較して次のような特徴があります。

Efficitent Neural Architecture Search(ENAS)によるニューラルネットワークの構造設計

マルチモーダル&マルチタスクにも対応

ENASによるニューラルネットワークの構造設計

AutoKerasはENASと呼ばれる効率的な最新のNeural Architecture Searchを実現しており、最適なニューラルネットワーク構造を自動で見つけてくれます。

AutoKerasのシステムアーキテクチャを図1に示します。API呼出し後の処理フローは次のようになっています。

Searcherのベイジアンオプティマイザーは、CPUを使って新しいニューラルアーキテクチャを生成する Graphモジュールは、生成されたニューラルアーキテクチャからRAM上にパラメーターを持つ実際のニューラルネットワークを構築する Model Trainerは、構築されたニューラルネットワークをGPUにコピーし、学習する 学習済みのニューラルネットワークはストレージに保存される

マルチモーダル&マルチタスクにも対応

AutoKerasでは、図2に示すようなマルチモーダルおよびマルチタスクニューラルネットワークモデルによる予測もできます。

マルチモーダルとは、さまざまな種類の情報(画像、テキスト、構造化データ)のことで、複数のデータソースからモデルを学習する仕組みをマルチモーダル学習といいます。例えば、写真を分類するために、画像に加えて、撮影日時や撮影場所(位置情報)などの構造化データも利用するような場合が考えられます。

同じ入力特徴量から複数のターゲットを予測するマルチタスクにも対応しています。複数のターゲットを1つのモデルで学習することをマルチタスク学習といいます。例えば、写真に写っている人物の性別を判定するだけでなく、その年齢を予測することなどが考えられます。

AutoModelクラスを使用して、マルチモーダルおよびマルチタスクニューラルネットワークを初期化し、学習するコードの例を示します。

# モデルの初期化 model = ak.AutoModel( inputs=[ak.ImageInput(), ak.StructuredDataInput()], outputs=[ ak.RegressionHead(metrics=["mae"]), ak.ClassificationHead(loss="categorical_crossentropy", metrics=["accuracy"]), ], overwrite=True, max_trials=2 ) # モデルの学習 model.fit( [image_data, structured_data], [regression_target, classification_target], epochs=3 )

