[評価指標]macro-F1/micro-F1、多クラス分類のマクロ平均/マイクロ平均とは?AI・機械学習の用語辞典

用語「macro-F1」「micro-F1」「マクロ平均」「マイクロ平均」について説明。macro-F1は、多クラス分類タスク(問題)に対する評価指標の一つで、クラスごとに計算したF1スコアの平均値を意味し、その値が1.0に近いほど分類を予測する機械学習モデルの性能が高い。

» 2022年12月19日 05時00分 公開
[一色政彦デジタルアドバンテージ]
「AI・機械学習の用語辞典」のインデックス

連載目次

用語解説

 統計学/機械学習におけるmacro-F1マクロ平均F1)スコアとは、(基本的に)多クラス分類のタスク(問題)に対する評価指標の一つで、クラスごとに計算したF1スコアの平均値を指す。また、micro-F1マイクロ平均F1)スコアとは、全クラス分をまとめて(=総計して)計算したF1スコアの値を指す。いずれも0.0(=0%)〜1.0(=100%)の範囲の値になり、1.0に近づくほどより良い。

図1 「macro-F1」を計算するための、各クラスのF1スコア計算のイメージ 図1 「macro-F1」を計算するための、各クラスのF1スコア計算のイメージ

 macro-F1とmicro-F1の使い分け指針を示しておく。

 不均衡データの場合には、macro-F1を使う方がよい。もう一方のmicro-F1スコアの計算方法では、特定のクラスの数に大きな偏りがある場合、適切に評価できない可能性が高いためだ。

 micro-F1スコアは、多クラス分類における正解率(Accuracy)と同じ計算結果となる。このため、もう一方のmacro-F1よりもエンドユーザーにとって理解しやすい、というメリットがある。エンドユーザーと評価結果をやり取りすることが重要な場面では、micro-F1(=正解率)の使用を検討するとよい。

 計算方法をあらためて説明すると、マクロ平均Macro Average)とは、多クラス分類のクラスごとに計算した評価指標(F1スコアや適合率再現率など)の平均を取ることである。適合率のマクロ平均は「macro-Precisionマクロ平均適合率)」、再現率のマクロ平均は「macro-Recallマクロ平均再現率)」などと呼ばれる。F1スコアのマクロ平均の計算方法を数式で表現すると、以下のようになる。F1スコア(score)の計算方法は、F1スコアの用語解説を参考にしてほしい。

 また、マイクロ平均Micro Average)とは、多クラス分類の全クラス分をまとめて(=総計して)計算した評価指標(F1スコアや適合率、再現率など)の値のことである。適合率のマイクロ平均は「micro-Precisionマイクロ平均適合率)」、再現率のマイクロ平均は「micro-Recallマイクロ平均再現率)」などと呼ばれる。F1スコアのマイクロ平均の計算方法を数式で表現すると、F1スコアの計算方法と同じなので、以下のようになる。

 ただし、TP/FP/FNの値は、クラスごと個別にカウントした数値ではなく、全クラスの合計値であるので注意してほしい。多クラス分類におけるTP/FP/FN値の計算方法は、「多クラス分類の混同行列」の用語解説を参考にしてほしい。

「AI・機械学習の用語辞典」のインデックス

AI・機械学習の用語辞典

Copyright© Digital Advantage Corp. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。