转:sensitivity和specificity

跟ROC类似,Lift(提升)和Gain(增益)也一样能简单地从以前的ConfusionMatrix以及Sensitivity、Specificity等信息中推导而来,也有跟一个baselinemodel的比较,然后也是很容易画出来,很容易解释。以下先修知识,包括所需的数据集:

  1. 分类模型的性能评估——以SAS Logistic回归为例(1): 混淆矩阵
  2. 分类模型的性能评估——以SAS Logistic回归为例(2): ROC和AUC

一些准备

说,混淆矩阵(Confusion Matrix)是我们永远值得信赖的朋友:

预测
10
1d, True Positivec, False Negativec+d, Actual Positive
0b, False Positivea, True Negativea+b, Actual Negative
b+d, Predicted Positivea+c, Predicted Negative

几个术语需要随时记起:

1.Sensitivity(覆盖率,TruePositive Rate)=正确预测到的正例数/实际正例总数

Recall (True Positive Rate,or Sensitivity) =true positive/totalactual positive=d/c+d

2. PV+ (命中率,Precision,PositivePredicted Value) =正确预测到的正例数/预测正例总数

Precision (Positive Predicted Value, PV+) =true positive/ totalpredicted positive=d/b+d

3.Specificity(负例的覆盖率,TrueNegative Rate) =正确预测到的负例个数/实际负例总数

Specificity (True Negative Rate) =true negative/total actualnegative=a/a+b

首先记我们valid数据中,正例的比例为pi1(念做pai1),在我们的例子中,它等于c+d/a+b+c+d=0.365。单独提出pi1,是因为有时考虑oversampling后的一些小调整,比如正例的比例只有0.001,但我们把它调整为0.365(此时要在SASproclogistic回归的score语句加一个priorevent=0.001选项)。本文不涉及oversampling。现在定义些新变量:

Ptp=proportion of true positives=d/a+b+c+d=(c+d/a+b+c+d)*(d/c+d)=pi1* Sensitivity,正确预测到的正例个数占总观测值的比例

Pfp=proportion of false positives=b/a+b+c+d= (a+b/a+b+c+d)*(b/a+b)= (1-c+d/a+b+c+d)*(1-a/a+b) = (1-pi1)*(1- Specificity),把负例错误地预测成正例的个数占总数的比例

Depth=proportion allocated to class1=b+d/a+b+c+d=Ptp+Pfp,预测成正例的比例

PV_plus=Precision (Positive Predicted Value, PV+) =d/b+d=Ptp/depth,正确预测到的正例数占预测正例总数的比例

Lift= (d/b+d)/(c+d/a+b+c+d)=PV_plus/pi1,提升值,解释见下节。

以上都可以利用valid_roc数据计算出来:

%let pi1=0.365;

datavalid_lift;

set valid_roc;

cutoff=_PROB_;

Ptp=&pi1*_SENSIT_;

Pfp=(1-&pi1)*_1MSPEC_;

depth=Ptp+Pfp;

PV_plus=Ptp/depth;

lift=PV_plus/&pi1;

keep cutoff _SENSIT_ _1MSPEC_ depth PV_plus lift;

run;

先前我们说ROC curve是不同阈值下Sensitivity和1-Specificity的轨迹,类似,

Lift chart是不同阈值下Lift和Depth的轨迹

Gains chart是不同阈值下PV+和Depth的轨迹

转:sensitivity和specificity
  

爱华网本文地址 » http://www.aihuau.com/a/25101014/215366.html

更多阅读

杨洋:我和杭州爱乐一起成长

杨洋:我和杭州爱乐一起成长文/汤葛月人(本文刊于《新西湖》2013年3月刊,未经许可不得用于其他商业用途) “从小练琴,被爸妈‘忽悠’做音乐家。”在这个仍旧有些阴冷的初春下午,问起小时候的梦想是什么,对面的青年指挥家这样笑着说。这

国学传统文化:中秋节和吃月饼的来历图

国学传统文化:中秋节和吃月饼的来历(图)中秋节起源于帝王祭月;月饼的命名和吃月饼起源于朱元璋。----- 诸葛长青马上就是农历八月十五“中秋”节了。今天的人们越来越重视这个节日了。为传承民族文化,增强民族凝聚力,中秋节从2008年

转载 美华转:反腐路上不怕鬼 不信邪

原文地址:美华转:反腐路上【不怕鬼】【不信邪】作者:美华博客3_0习访美,在西雅图首站演说就罕见提到「反腐斗争」。还记得3年前中共十八大,习的「就职演说」吗?「打铁还需自身硬」、「物必先腐后虫生」。习不仅将「反腐」放到施政首位,赴美

转载 敬请再转:2014高考作文完整版

原文地址:敬请再转:2014高考作文完整版作者:中国教师梁恕俭2014高考作文·广东卷黑白胶片的时代,照片很少,只记录下人生的几个瞬间,在家人一次次的翻看中,它能唤起许多永不褪色的记忆。但照片渐渐泛黄,日益模糊。数码科技的时代,照片很多,记

转载 转:大威德金刚仪轨

原文地址:转:大威德金刚仪轨作者:清净法身佛注:我博客中所有密宗法,無論是修本尊還是修護法,內容均是轉帖來的。您可以看看瞭解一下,沒有經過灌頂不可隨便修持,恐不如法給自己帶來不便,慎之!阿彌陀佛!

声明:《转:sensitivity和specificity》为网友深爱诗心分享!如侵犯到您的合法权益请联系我们删除