モデルを評価する(補足)

交差検証という名称について

前のエントリーで、交差検証について書きましたが、交差検定と呼ばれることもあります(ありました?)。ただ、検定というと、統計学の用語であって、あらぬ誤解を生む可能性があるので、交差検証又は交差確認という言葉を使うほうが良いかもしれません。

精度と再現率の調和平均について

また、前のエントリーで、精度と再現率はトレードオフの関係と書きました。そこで、これら2つの調和平均を計算して、この値が高ければ、バランスの良いモデルができているんじゃないか、と判断することができそうです。

精度と再現率の調和平均のことをF値(F-measure)と呼んでいます。

 F = \displaystyle \frac{2 \cdot Precision \cdot Recall}{Precision + Recall}

また、どちらかにウェイトを置いて計算するときは、次の式を用います。

 F_{\beta} = \displaystyle \frac{(1+\beta^{2}) \cdot Precision \cdot Recall}{\beta^{2} \cdot Precision + Recall}

例えば再現率を重視するスコアとして、F3スコア(下の式でβの値を3にしたもの)を用いる場合があります。