欢迎大家来到IT世界,在知识的湖畔探索吧!
在评价机器学习模型或二分类问题模型检测效果上,经常会涉及几个评价指标,有准确率、精确率、召回率和F1值,人们往往会对这几个词语容易混淆,难以准确把握它们的含义,下面就对这几个词语进行说明,方便大家制定合适的模型评价指标。
背景知识:
在理解四个指标前,先用不同的字母表示不同的结果。T(True)、F(false)、P(Positive)、N(Negative),根据真实结果和判断结果,标出判断结果T/F。通过以下的表格方便大家理解。
混淆矩阵 |
真实结果 |
||
T |
F |
||
判断结果 |
T |
TP |
FP |
F |
FN |
TN |
TP:表示真实结果为真,判断结果也是为真,判断正确
FP:表示真实结果为假,但是被误判为真,判断错误
FN:真实结果为真,但是被误判为假,判断错误
TN:表示真实结果为假,判断结果也是为假,判断正确
1、准确率
准确率(Accuracy),即判断结果为正确占总样本的百分比,表达式如下:
准确率=(TP+TN)/ (TP+TN+FP+FN),
从该表达式可以看出分子包括了TP和TN,即含了检测出与真实结果一致的情况,但这里就含有真实正样本和真实负样本两种情况,如果两者样本数偏差较大,如合格品大概为95%,次品为5%,如果都预测为合格,那么准确率就高达了95%,这样的准确率不能很好反映模型的真实效果,所以还需要后面的几个指标。
2、精确率
精确率(Precision),指真实结果为真占所有判断结果为真的样本的概率,表达式如下:
精确率=TP / (TP+FP)
一般的人会比较容易混淆精确率和准确率两个概念。精确率是对正样本的判断准确度,而准确率是对整体样本的判断准确程度,其中的区别可以从表达式能清楚可知。
3、召回率
召回率(Recall),指真实为真的样本占所有被判断为真样本的比例。
表达式为召回率=TP/(TP+FP)
比如:样本中共有10个鸡蛋,其中有4个是坏鸡蛋。设计模型进行检测找出坏鸡蛋,最后找到了5个,但是其中只有3个是坏鸡蛋。那么模型的精确率为3/5=60%,即找到了5只鸡蛋中,只找对了3个。
模型的召回率是3/4=75%,需要找到的是4个坏鸡蛋,但是只找到3个。
这个是关于召回率和精确率的例子,可以帮助大家对概念的理解。
4、F1值
F1值,即F1-Score。前面提到的精确率,又叫查准率,召回率又叫查全率。在实际的计算中,精确率和召回率往往很难两全其美,所以通过F1值寻找两者的平衡点。
F1值表达式为F1-Score=2*精确率*召回率/(精确率+召回率)
希望能通过本介绍对大家的学习和工作有帮助,欢迎多加关注。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://itzsg.com/56487.html