[評価指標]正解率(Accuracy)とは?AI・機械学習の用語辞典

用語「正解率」について説明。分類タスク(問題)に対する評価指標の一つで、機械学習モデルによる予測結果における正解数をデータ数で割った値を指す。

» 2024年02月05日 05時00分 公開
[一色政彦デジタルアドバンテージ]
「AI・機械学習の用語辞典」のインデックス

連載目次

用語解説

 正解率Accuracy、正確さ、正確度、確度)とは、機械学習モデルや統計モデルなどのモデルが正しく予測できた割合を表す。例えば100枚の画像が犬か猫かを分類する問題において、95枚の画像を正しく分類した場合、正解率は0.95(=95%)になる。

 より厳密には、正解率は統計学/機械学習における二値分類(=例えば犬か猫かのように、データを2つのクラスのいずれかに分類)や多クラス分類(=例えば犬か猫か熊かなどのように、データを3つ以上のクラスのいずれかに分類)のタスク(問題)に対する評価指標の一つで、モデルによる予測結果などにおける正解数をデータ数で割った値である。0.0(=0%)〜1.0(=100%)の範囲の値になり、1.0に近づくほどより良い。

図1 「正解率」のイメージ 図1 「正解率」のイメージ

 ただし、データセットが不均衡な場合(例えば犬の画像が95枚で、猫の画像が5枚の場合)、正解率だけではモデルの性能を完全には反映しないことがある。このような状況では、他の指標(適合率再現率/感度特異度F1スコアなど)も併用して、モデルの性能を評価することが推奨される。

 正解率は、場合によっては一般的な用語の意味で「精度」と表現される場合もある。この場合の「精度」は、「性能(performance:どれくらい良い結果か)」に近い意味で用いられている(と筆者は考えている)。しかし統計学や科学における専門的な用語の意味では、「正解率(accuracy)」と「精度(precision)」は明確に区別されるので注意してほしい。精度(precision)は、精密度(=適合率)を表す用語で、二値分類で陽性(positive)と予測したもの中で実際に陽性であった確率を指す。正解率と精度は違う尺度なので通常は一致しない。

 正解率の計算方法は説明済みだが、あらためて計算式を書き出すと以下のようになる。二値分類の混同行列で表現した計算式を2行目に示している。

「AI・機械学習の用語辞典」のインデックス

AI・機械学習の用語辞典

ここを更新しました(2024年02月05日)

正解率の定義をできるだけ平易な言葉で書き直しました。二値分類や多クラス分類の説明を追記しました。不均衡データに関する注意点を追記しました。

Copyright© Digital Advantage Corp. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。