ウォール街アナリストを上回る企業業績予測モデル、MITが開発:確率伝播法を採用した機械学習モデル
MITの研究チームが、企業の四半期業績を予測する数理モデルを開発した。ウォール街のアナリストを超える成績を実証した。特徴は匿名化された週次のクレジットカード取引データと四半期業績レポートのみを使用したことだ。
マサチューセッツ工科大学(MIT)の研究チームは、企業の四半期業績を予測する数理モデルを開発した。匿名化された週次のクレジットカード取引データと四半期業績レポートというごく限られた情報だけを用いていることが特徴。
開発したモデルを使って34社の四半期業績を予測したところ、57%においてウォール街のアナリストの平均予測を上回る精度を実現した。今回の研究で注目すべき点は豊富な情報を利用できるアナリストよりも圧倒的に少ないデータだけを用いて的確な予測を下したことだ。
ウォール街のアナリストは業績予測に当たって、使用可能なプライベートデータと公的データ、今回のものとは異なる機械学習モデルにアクセスできたのに対し、研究チームが開発したモデルは、非常に小規模な2種類のデータセットのみを使用した。
代替データが使いにくい理由は?
金融業界では現在、企業が発表する業績データ以外に、「代替データ」を用いた企業収益予測に対して関心が高まっている。用途は取引や投資だ。
代替データとは漠然としているが頻繁に生成される消費者データをいう。例えばクレジットカード取引データやスマートフォンから得られる位置データ、小売店舗の駐車場の混雑具合を示す衛星画像などであり、代替データの種類は多岐にわたる。
だがこれまでのところ、代替データを使って正確な予測を頻繁に行うことは、非常に難しかった。なぜだろうか。
研究者によれば、データの量が不足しているためだという。四半期ごとのレポートや各週のクレジットカード取引などの財務入力は1つの数値のみから構成されている。つまり2年間の四半期報告では、合計しても8つのデータポイントしかない。例えば、同じ期間の毎週のクレジットカードデータは、約100個のノイズの多いデータポイントにすぎない。つまり、これらのデータには解釈できない情報が含まれている可能性がある。
ノイズが多いデータを扱う手法が今回の研究では中心を占めた。博士課程を修了後、MITの情報/意思決定システム研究所(LIDS)で研究を行い、論文の第一著者を務めたマイケル・フレダー氏は次のように述べている。
「われわれは、『代替データというノイズの多いシグナルと、四半期業績データを組み合わせて、企業業績を高頻度に予測することは可能か』という問いを立てた。研究の結果、答えはイエスである」
研究チームが開発した予測モデルは、投資家やトレーダー、あるいは自社と競合他社の売り上げを頻繁に比較する企業にとって、有力なツールになる可能性がある。もちろん社会科学者や政治科学者が、大量の匿名データを使って人々の行動を研究する場合などにも役立ちそうだ。
「このモデルは、人々が何を行おうとしているかを理解したいと考える全ての人に役立つだろう」(フレダー氏)
機械学習をどのように活用したのか
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 約67万倍の高速化と約10倍の高精度化を達成したAI技術を大阪大学が開発
大阪大学産業科学研究所・産業科学AIセンターの副センター長を務める櫻井保志氏のグループは、時系列ビッグデータを高い精度でリアルタイムに要因分析し、将来予測するAI技術を開発した。約67万倍の高速化と、約10倍の高精度化を達成したとしている。 - 運転データから運転手を特定、機械学習で交通事故を予防できるか
損害保険ジャパン日本興亜(以下、損保ジャパン日本興亜)と理化学研究所の革新知能統合研究センターは共同で、「運転データによる大規模ドライバー識別技術」と「多重比較補正を利用した統計的軌跡マイニング技術」を開発した。交通事故予測のための研究成果だ。事故リスク評価モデルなどを支える基盤アルゴリズムとして実用化する。 - 機械学習を用いた予測分析ソフトウェア「Prediction One」を無償提供 ソニー
ソニーは機械学習を用いた予測分析ソフトウェア「Prediction One」を、法人向けに無償提供する。利用者にデータ処理に関する専門知識や経験がなくても、精度の高い予測が可能。