用語「macro-F1」「micro-F1」「マクロ平均」「マイクロ平均」について説明。macro-F1は、多クラス分類タスク(問題)に対する評価指標の一つで、クラスごとに計算したF1スコアの平均値を意味し、その値が1.0に近いほど分類を予測する機械学習モデルの性能が高い。
統計学/機械学習におけるmacro-F1(マクロ平均F1)スコアとは、(基本的に)多クラス分類のタスク(問題)に対する評価指標の一つで、クラスごとに計算したF1スコアの平均値を指す。また、micro-F1(マイクロ平均F1)スコアとは、全クラス分をまとめて(=総計して)計算したF1スコアの値を指す。いずれも0.0(=0%)〜1.0(=100%)の範囲の値になり、1.0に近づくほどより良い。
macro-F1とmicro-F1の使い分け指針を示しておく。
不均衡データの場合には、macro-F1を使う方がよい。もう一方のmicro-F1スコアの計算方法では、特定のクラスの数に大きな偏りがある場合、適切に評価できない可能性が高いためだ。
micro-F1スコアは、多クラス分類における正解率(Accuracy)と同じ計算結果となる。このため、もう一方のmacro-F1よりもエンドユーザーにとって理解しやすい、というメリットがある。エンドユーザーと評価結果をやり取りすることが重要な場面では、micro-F1(=正解率)の使用を検討するとよい。
計算方法をあらためて説明すると、マクロ平均(Macro Average)とは、多クラス分類のクラスごとに計算した評価指標(F1スコアや適合率、再現率など)の平均を取ることである。適合率のマクロ平均は「macro-Precision(マクロ平均適合率)」、再現率のマクロ平均は「macro-Recall(マクロ平均再現率)」などと呼ばれる。F1スコアのマクロ平均の計算方法を数式で表現すると、以下のようになる。F1スコア(score)の計算方法は、F1スコアの用語解説を参考にしてほしい。
また、マイクロ平均(Micro Average)とは、多クラス分類の全クラス分をまとめて(=総計して)計算した評価指標(F1スコアや適合率、再現率など)の値のことである。適合率のマイクロ平均は「micro-Precision(マイクロ平均適合率)」、再現率のマイクロ平均は「micro-Recall(マイクロ平均再現率)」などと呼ばれる。F1スコアのマイクロ平均の計算方法を数式で表現すると、F1スコアの計算方法と同じなので、以下のようになる。
ただし、TP/FP/FNの値は、クラスごと個別にカウントした数値ではなく、全クラスの合計値であるので注意してほしい。多クラス分類におけるTP/FP/FN値の計算方法は、「多クラス分類の混同行列」の用語解説を参考にしてほしい。
Copyright© Digital Advantage Corp. All Rights Reserved.