机器学习之平均精确率均值(Average Precision)
如大家所了解的平均精确率均值Average Precision, AP是 P-R 曲线下的面积。AP 衡量了模型在不同召回率水平下的平均精确率越高的 AP 值表示模型性能越好。ROC曲线ROC曲线 Receiver Operating Characteristic Curve 是以不同阈值下的假阳性率 False Positive Rate 和真阳性率 True Positive Rate 为横纵轴绘制的曲线。其中 FPR 和 TPR 的定义如下$$FPR \frac{FP}{FP TN}$$$$TPR recall \frac{TP}{TP FN}$$按照上述的例子假阳率的计算为真阳率的计算为在计算了 TPR 和 FPR 之后我们就能得到一个 ROC 曲线上的一个坐标点即( 0.044 , 0.8 )。要绘制完整的 ROC 曲线需要在不同的阈值下计算多个 TPR 和 FPR 值并将它们连接起来形成一条曲线即完整的 ROC 曲线。对于 ROC 曲线来说x 轴的值越小则负样本中被误报的比例越小真阴性越多。y 的值越大则真阳性的比例更大假阴性越少漏报较低。ROC 曲线更接近左上角说明模型能够有效地区分正例和负例。通过观察 ROC 曲线的形状和接近左上角的程度我们可以了解模型在不同阈值下的性能优劣。绘制 ROC 曲线后可以通过平衡误报和漏报的情况来选择合适的阈值。