適合率と再現率のグラフ

実はここがこのメモを書いた原因の箇所です。つまずきました。。
研究で検索システムを作ってこのグラフで評価しようと思ったら??となりました。。
結論から言うと適合率と再現率のグラフは以下の図のようになるそうです。

汚い図ですが, 縦軸が適合率, 横軸が再現率です。


直感的に考えると,今までの考察から

・適合率
理想的な(ある程度精度が良い)情報検索システムにおいては, 検索結果を多く含めるほど減少
・再現率
検索対象としたサイト群が同じと仮定すると, 検索結果を多く含めるほど減少

すなわち,
・適合率:Sが大きくなる=減少する, Sが小さくなる=増加する
・再現率:Sが大きくなる=増加する, Sが小さくなる=減少する
なので

・適合率が減少すると(Sが大きくなっているので)再現率は増加
・適合率が増加すると(Sが小さくなっているので)再現率は減少
ただし, 理想的な(ある程度精度が良い)情報検索システムで検索対象としたサイト群が同じ

と図と対応付けられます。


それでは, ver0とver1のデータより実際に適合率と再現率のグラフを求めてみます。
ver0は適合率のグラフで減少してたので, どんなグラフになるのか気になります。

縦軸が適合率, 横軸が再現率でRの要素数を20としました。


だいぶ, 予想と反していますね。。もう一度考察しなおしてみますm(_ _)m
今回は, 時間の都合上ここまで。