時系列予測のベストプラクティスを共有するGitHubリポジトリを開設、Microsoft:PythonやR向け
Microsoftは、時系列予測のベストプラクティスを共有するためのGitHubリポジトリを開設した。PythonやRを使っている開発者に向けたものだ。
Microsoftの「R」コミュニティー向けブログサイト「Revolutions」は、2020年4月14日(米国時間)、時系列予測のベストプラクティスを共有するためのGitHubリポジトリ「Time Series Forecasting Best Practices & Examples」を開設したと発表した。
Microsoftはこのリポジトリについて、README.mdで次のように説明している。
「時系列予測は、データサイエンスで最も重要なトピックの一つだ。的確な意思決定と効果的な資源配分を行うために、ほぼ全ての企業には未来を予測する必要がある。このリポジトリは、予測ソリューションを構築するためのサンプルとベストプラクティスガイドラインを提供する。このリポジトリの目標は、予測アルゴリズムの最新の進化を利用して、ソリューションを構築し、運用するためのツールとサンプルの包括的なセットを用意することにある。われわれはゼロから実装を始めるのではなく、既存の最先端のライブラリを利用し、データの処理と特徴化、モデルの最適化と評価、クラウドへのスケールアップに向けた追加のユーティリティーを開発した」
PythonやRから利用できる
公開したリポジトリには、Python環境であるJupyter Notebookや、統計処理言語RのMarkdownドキュメントなど、さまざまな時系列モデリング手法の詳細サンプル(ノートブック)が含まれている。また、「Azure Machine Learning」サービスの時系列モデルに適合し、予測をWebサービスとして運用するためのノートブックも含まれる。
例えばRのサンプルには、83店舗の冷凍オレンジジュースの販売データを使って、時系列予測の幾つかの手法を示している(「bayesm」パッケージから取得したもの)。扱われている手法は内挿法による期待値予測、ARIMA(Autoregressive Integrated Moving Average:自己回帰和分移動平均)モデル、指数平滑化法、加法モデルなどさまざまだが、いずれも「tidyverts」パッケージスイートを幅広く利用している。このパッケージは、「tidy time series forecasting for R」(Rのきちんとした時系列予測)を実現する。
なお、予測手法自体については、オンラインで公開されている書籍「Forecasting: Principles and Practice」(モナッシュ大学)に解説がある。
R Markdownファイルのサンプルを試す
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 2020年1月版:AI/機械学習/データサイエンス関連ニュースまとめ
Microsoftの「R」コミュニティー向けブログサイトが、AIや機械学習、データサイエンスなどに関する2020年1月のニュースのまとめを掲載した。 - Microsoft、.NET開発者向け機械学習フレームワークの新版「ML.NET 1.2」を発表
Microsoftは、.NET開発者向けの機械学習(ML)フレームワークの最新版「ML.NET 1.2」を発表した。下位互換性を維持しながら、さまざまな改良を施した。予測と異常検知を担うパッケージや「TensorFlow」を使うためのパッケージが正式版になった。 - Prophetを、リクルートグループWebサイトの数カ月先の日次サーバコール数予測で活用してみた話
Facebookが開発した時系列予測のOSSライブラリ「Prophet」が近年注目を集めている。本連載ではProphetの概要と理論的背景、案件で使ってみた経験から得られた知見を紹介する。後編はチューニングのテクニックや運用時の注意点などについて。