首先,我们需要了解一下,什么是ROC曲线?
ROC曲线,即受试者工作特征曲线(Receiver Operating Characteristic curve,简称ROC曲线,是根据一系列不同的二分类方式,以真阳性率(TPR)为纵坐标,假阳性率(FPR)为横坐标绘制成的曲线,描述的是一个模型的性能。
依旧是以之前的图片为例子:
对于ROC曲线,我们可以首先求出TPR和FPR两个指标:
以下图为例,
哪条ROC曲线对应的分类器效果好?
我们将曲线与x轴的面积定义为AUC(Area Under Curve),即ROC曲线下的面积。其中,AUC越大,代表分类器的效果越好。因此,B的效果要比A好得多。
AUC的取值范围通常为【0.5,1】之间,倘若一个模型的AUC的值小于0.5,那么我们便认为这个模型是没有意义的。