📘

評価指標

評価指標

実際にAIモデルを業務適用するにはグラフでの定性的な確認だけでなく、評価指標による定量的な判断が必要です。
判断に用いる評価指標の種類や目標値は課題や状況に応じて異なります。各指標の特徴を把握し、適切に選択してください。
指標説明
RMSE (Root Mean Squared Error) 二乗平均平方根誤差予測値と実測値の誤差を二乗し、平均した後に平方根をとった指標です。外れ値の影響をより強く反映する特徴があります。 値が小さいほど良いです。
CORR (Correlation Coefficient) ピアソンの相関係数実測値と予測値の連動性の強さを示します。予測値が増減した際、実測値も同様に増減しているかを見ることができます。 値が大きいほど良いです。
MAE (Mean Absolute Error) 平均絶対誤差予測値と実測値の誤差の絶対値を平均した指標です。直感的に誤差の大きさを理解しやすく、外れ値の影響を受けにくい特徴があります。 値が小さいほど良いです。
MAPE (Mean Absolute Percentage Error) 平均絶対パーセント誤差実測値に対して、予測誤差が何%程度あるかを示した指標です。スケールの異なるデータ間でも精度の比較がしやすい特徴があります。 ※ Node-AIでは、実測値が0のレコードは除外して計算されます。 値が小さいほど良いです。
(Coefficient of Determination) 決定係数データの変動をモデルがどれだけ説明できているかを表す指標です。 値が大きいほど良いです。
💡
MAPEが異常に大きな値になってしまうのはなぜ?
予測はそこまで外れていないはずなのに、MAPEだけ異常に大きな値になってしまう場合があります。
これはモデルの精度が悪いわけではなく、「正解データ(実測値)に 0 に近い数字が含まれていること」が主な原因です。
MAPEが大きくなりやすいのは、以下の2つの理由です。
 
1. 実測値が0に近いと誤差が過剰に評価されるため
MAPEは実測値に対して、誤差が何%あるかを計算します。そのため、実測値が0に極端に近いと、少しの誤差でも計算結果が跳ね上がってしまいます。
簡単な例:
  • 実測値:100、予測値:101 の場合
    • 誤差は 1 です。MAPEは 1% となります。
  • 実測値:0.01、予測値:1.01 の場合
    • 誤差は同じ 1 ですが、実測値が小さすぎるため、MAPEは 10000% になります。
このように、0付近のデータが多く含まれる場合、MAPEは実態よりも悪く見えてしまう性質があります。
 
2. 比率が成立しないデータを扱っているため
MAPEは「割合(比率)」で精度を見る指標ですが、世の中にはそもそも比率で考えることが適さないデータが存在します。代表例が「気温(摂氏)」です。
  • 「1℃」から「2℃」になった時、数字は2倍ですが、熱エネルギーが2倍になったわけではありません。
  • 「0℃」は水が凍る温度であって、「熱エネルギーが無い」状態ではありません。
このように0 が「無」を意味しないデータ(間隔尺度といいます)に対して、無理やり%を計算しようとすると、数値的な意味が破綻してしまいます。
 
もし評価対象のデータに「0付近の値」が多く含まれていたり、気温のようなデータである場合は、MAPEの値が高くても気にしすぎないでください。
その場合は、MAE(平均絶対誤差) をメインの指標として確認することをお勧めします。MAEであれば、実測値の大きさに関わらず「平均して何℃ズレているか」「何個ズレているか」を直感的に評価できます。