先搞清楚,TP、FP、FN、TN这四个值的意思,用官方的话来讲:
名称 | 意思 |
---|---|
TP(True positive) | 真正例,将正类正确预测为正类数 |
FP(False positive) | 假正例,将负类错误预测为正类数 |
FN(False negative) | 假负例,将正类错误预测为负类数 |
TN(True negative) | 真负例,将负类正确预测为负类数 |
用人话来讲:
精确率体现的是在所有预测出的样本中,有多少是被正确预测的。
P
=
(
T
P
T
P
+
F
P
)
P= (\frac {TP}{TP + FP} ) \quad
P=(TP+FPTP)
召回率是针对原先实际样本而言,有多少样本本准确预测。
R
=
(
T
P
T
P
+
F
N
)
R= (\frac {TP}{TP + FN} ) \quad
R=(TP+FNTP)
F1分数是统计学中用来衡量二分类模型精确度的一种指标。它同时兼顾了分类模型的精确率和召回率。
F1分数可以看作是模型精确率和召回率的一种加权平均,最大值为1,最小为0。
F
1
=
2
∗
(
P
∗
R
P
+
R
)
F_1= 2*(\frac {P * R}{P+R} ) \quad
F1=2∗(P+RP∗R)