統計学/機械学習における正解率(Accuracy、正確さ、正確度、確度)とは、二値分類や多クラス分類のタスク(問題)に対する評価指標の一つで、機械学習モデルによる予測結果などにおける正解数をデータ数で割った値である。0.0(=0%)〜1.0(=100%)の範囲の値になり、1.0に近づくほどより良い。
正解率は、場合によっては一般的な用語の意味で「精度」と表現される場合もある。この場合の「精度」は、「性能(performance:どれくらい良い結果か)」に近い意味で用いられている(と筆者は考えている)。しかし統計学や科学における専門的な用語の意味では、「正解率(accuracy)」と「精度(precision)」は明確に区別されるので注意してほしい。精度(precision)は、精密度(=適合率)を表す用語で、二値分類で陽性(positive)と予測したもの中で実際に陽性であった確率を指す。正解率と精度は違う尺度なので通常は一致しない。
正解率の計算方法は説明済みだが、あらためて計算式を書き出すと以下のようになる。二値分類の混同行列で表現した計算式を2行目に示している。
Copyright© Digital Advantage Corp. All Rights Reserved.