面积曲线 AUC(area under curve)
1 ROC
首先介绍 ROC。ROC 分析是从医疗分析领域引入了一种新的分类模型 performance 评判方法。
ROC 的全名叫做 Receiver Operating Characteristic,其主要分析工具是一个画在二维平面上的曲线——ROC curve。平面的横坐标是 false positive rate(FPR),纵坐标是 true positive rate(TPR)。对某个分类器而言,我们可以根据其在测试样本上的表现得到一个 TPR 和 FPR 点对。这样,此分类器就可以映射成 ROC 平面上的一个点。调整这个分类器分类时候使用的阈值,我们就可以得到一个经过(0, 0),(1, 1)的曲线,这就是此分类器的 ROC 曲线。一般情况下,这个曲线都应该处于(0, 0)和(1, 1)连线的上方。因为(0, 0)和(1, 1)连线形成的 ROC 曲线实际上代表的是一个随机分类器。虽然,用 ROC curve 来表示分类器的 performance 很直观好用。可是,人们总是希望能有一个数值来标志分类器的好坏。于是 Area Under roc Curve(AUC)就出现了。
2 AUC
AUC 是一种用来度量分类模型好坏的一个标准。顾名思义,AUC 的值就是处于 ROC curve 下方的那部分面积的大小。通常,AUC 的值介于 0.5 到 1.0 之间,较大的 AUC 代表了较好的 performance。
AUC 的计算方法总结:
AUC 的值就是计算出 ROC 曲线下面的面积
学习更多编程知识,请关注我的公众号:
版权声明: 本文为 InfoQ 作者【代码的路】的原创文章。
原文链接:【http://xie.infoq.cn/article/0a73743b5ddec6fac2e5c146d】。文章转载请联系作者。
评论