連載
評価関数(Evaluation function)/評価指標(Metrics)とは?:AI・機械学習の用語辞典
用語「評価関数」について説明。機械学習モデルの性能/精度をスコアリングして評価するための関数を指し、例えば回帰問題なら平均二乗誤差、分類問題なら正解率などの関数がある。
用語解説
AI/機械学習の評価関数(Evaluation function)とは、機械学習モデルの性能(performance、精度)をスコアリング(=点数化)して測定するための関数のこと。その関数の出力値が性能を評価するための指標(Metrics:メトリクス)となる。
モデル間で性能の良さを比較するためなどにも使われ、例えばKaggleに代表されるコンペティション(競技大会)では、評価関数の出力値などによってランキングが決定する。
損失関数と同じものが、そのまま評価関数として使われることもある。それ以外にも、下記のように用途ごとに多種多様な評価関数があるが、特に回帰問題なら平均二乗誤差(MSE)、分類問題なら正解率(Accuracy)が有名である。
回帰問題の代表的な評価関数
- 平均絶対誤差(MAE:Mean Absolute Error)
- 平均二乗誤差(MSE:Mean Squared Error)
- 平均二乗誤差の平方根(RMSE:Root Mean Squared Error)
- 平均二乗対数誤差(MSLE:Mean Squared Logarithmic Error)
- 平均二乗対数誤差の平方根(RMSLE:Root Mean Squared Logarithmic Error)
- 平均絶対パーセント誤差(MAPE:Mean Absolute Percentage Error)
- 平均二乗パーセント誤差の平方根(RMSPE:Root Mean Squared Percentage Error)
二値分類問題の代表的な評価関数
- 正解率(Binary Accuracy)
- 適合率(Precision)
- 再現率(Recall)/感度(Sensitivity)
- 特異度(Specificity)
- F値(F-measure、F-score)/F1スコア(F1-score)
- 重み付きF値(Weighted F-measure)/Fβスコア(Fβ-score)
- LogLoss(Binary Logarithmic Loss)
- AUC(Area Under the ROC curve、ROC曲線のAUC)
- PR-AUC(Area Under the Precision-Recall curve、AUC-PR)/AP(Average Precision)
多クラス分類問題の代表的な評価関数
- 正解率(Multi-class Accuracy)
- LogLoss(Multi-class Logarthimic Loss)
Copyright© Digital Advantage Corp. All Rights Reserved.