Microsoftは、時系列予測のベストプラクティスを共有するためのGitHubリポジトリを開設した。PythonやRを使っている開発者に向けたものだ。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
Microsoftの「R」コミュニティー向けブログサイト「Revolutions」は、2020年4月14日(米国時間)、時系列予測のベストプラクティスを共有するためのGitHubリポジトリ「Time Series Forecasting Best Practices & Examples」を開設したと発表した。
Microsoftはこのリポジトリについて、README.mdで次のように説明している。
「時系列予測は、データサイエンスで最も重要なトピックの一つだ。的確な意思決定と効果的な資源配分を行うために、ほぼ全ての企業には未来を予測する必要がある。このリポジトリは、予測ソリューションを構築するためのサンプルとベストプラクティスガイドラインを提供する。このリポジトリの目標は、予測アルゴリズムの最新の進化を利用して、ソリューションを構築し、運用するためのツールとサンプルの包括的なセットを用意することにある。われわれはゼロから実装を始めるのではなく、既存の最先端のライブラリを利用し、データの処理と特徴化、モデルの最適化と評価、クラウドへのスケールアップに向けた追加のユーティリティーを開発した」
公開したリポジトリには、Python環境であるJupyter Notebookや、統計処理言語RのMarkdownドキュメントなど、さまざまな時系列モデリング手法の詳細サンプル(ノートブック)が含まれている。また、「Azure Machine Learning」サービスの時系列モデルに適合し、予測をWebサービスとして運用するためのノートブックも含まれる。
例えばRのサンプルには、83店舗の冷凍オレンジジュースの販売データを使って、時系列予測の幾つかの手法を示している(「bayesm」パッケージから取得したもの)。扱われている手法は内挿法による期待値予測、ARIMA(Autoregressive Integrated Moving Average:自己回帰和分移動平均)モデル、指数平滑化法、加法モデルなどさまざまだが、いずれも「tidyverts」パッケージスイートを幅広く利用している。このパッケージは、「tidy time series forecasting for R」(Rのきちんとした時系列予測)を実現する。
なお、予測手法自体については、オンラインで公開されている書籍「Forecasting: Principles and Practice」(モナッシュ大学)に解説がある。
Copyright © ITmedia, Inc. All Rights Reserved.