Webブラウザーだけで学ぶ機械学習の「お作法」：Webブラウザーでできる機械学習Azure ML入門（2）（4/4 ページ）

» 2014年12月01日 20時30分公開

[あけり，＠IT]

前のページへ 1|2|3|4 　　　　　　

お作法5：予測と検証

　次は、実際に予測してみて、それが正しいかどうかを検証します。今回のサンプルでは再下段に相当します。

Score Matchbox Recommender

　Score Matchbox Recommenderでは先ほどのTrain Matchbox Recommenderの学習結果を利用して、オススメ順にレストランを出してくれる機能です。

Score Matchbox Recommender

　Score Matchbox Recommenderの入力は、四つあります。四つの入力は次のようになっています。

Trained Matchbox recommender
Dataset to score
User features
Item features

　これらの項目それぞれの詳細はドキュメントで確認するとして、ここでは必要な部分に絞ってみていきましょう。これを見ると、箱の上辺一番左側の○印にはTrain Matchbox Recommenderの出力を入れるようになっています。ここでは学習の「結果（＝出力データ）」を利用することができるようになっています。実際のフローを見てみても、Train Matchbox Recommenderにつながっています。

　Dataset to scoreには、Splitで分割した検証用に使うための実データを入力します。残り二つには学習の時と同じユーザーの情報、レストランの情報を入力します。ここでの出力は、このユーザーにとって評価が高いであろうレストランの一覧になります。実際にこの段階での出力データを見てみましょう。

学習結果の予測内容を確認してみる

　UserとItem（この場合はレストランを指します）の組み合せが出てきました。一つ例に挙げてみると、U1048というユーザーは135034のレストランに対して高い評価をするであろうという予測が出ています。言い換えると、「U1048というユーザーに135034のレストランをオススメしている」ということです。

Evalute Recommender

　次にこの結果がどの程度妥当なのかを検証します。もし妥当であれば、この機械学習のモデルは実践に投入できるかもしれません。テストには「Evaluate Recommender」という箱を利用します。

　入力には、先ほどSplitで検証用として取り出したデータを利用します。前述のScore Matchbox Recommenderで使ったものと同じものが入力されることになります。これによって、Score Matchbox Recommenderが出力した結果と、もともと答えの入っているデータの検証ができるようになります。

　nDCG（normalized discounted cumulative gain）という方法を使い、どの程度の精度が出ているのかを検証しています。