当前位置: 首页 > 知识库问答 >
问题:

第一次预测的精确度、F分数和召回率较高

艾骏喆
2023-03-14

我已经打印了我的二元类SVM模型预测的分类报告,但是第一次预测的得分很高(超过95%),我知道打印高值是好的,但是之后我需要进行特征选择,你认为这正常吗?什么样的特征选择适合于二值分类?

共有1个答案

祁飞飙
2023-03-14

你觉得这正常吗?

这取决于你的数据。如果你的数据是完全线性可分离的,那么几乎所有线性分类器都会表现良好。

如果所有的精确性、召回率和F分数都很高,并且对你来说足够高,那么也许你不必再进一步了。

您可以看到特征的重要性,然后可以阅读这篇文章:确定sklearn中支持向量机分类器最重要的特征

如果使用另一种算法,特征的重要性可能会略有不同。

 类似资料:
  • 问题内容: 我正在使用Python,并且有一些混淆矩阵。我想通过多类分类中的混淆矩阵来计算精度,召回率和f测度。我的结果日志不包含和,仅包含混淆矩阵。 您能否告诉我如何从多类别分类的混淆矩阵中获得这些分数? 问题答案: 让我们考虑MNIST数据分类(10个类)的情况,对于10,000个样本的测试集,我们得到以下混淆矩阵(Numpy数组): 为了获得精度和召回率( 每类 ),我们需要计算 每类 的T

  • 有了召回率和准去率这俩个评价指标后,不就非常好了,为什么要有F值这个评价量的存在呢? 我们在评价的时候,当然是希望检索结果Precision越高越好,同时Recall也越高越好,但事实上这两者在某些情况下有矛盾的。 比如极端情况下,我们只搜索出了一个结果,那么Precision就是100%,但是Recall为1/6就很低;而如果我们抽取10个,那么比如Recall是100%,但是Precision为6/10,相对来说就会比较低。

  • 本文向大家介绍分类问题的指标?准确度、召回率、PR曲线?相关面试题,主要包含被问及分类问题的指标?准确度、召回率、PR曲线?时的应答技巧和注意事项,需要的朋友参考一下 在数据不平衡时,PR曲线是敏感的,随着正负样本比例的变化,PR会发生强烈的变化。而ROC曲线是不敏感的,其曲线能够基本保持不变。

  • 问题内容: 我正在研究情绪分析问题,数据看起来像这样: 所以,我的数据是不平衡的,因为1190标有。对于使用scikit的SVC进行的分类Im 。问题是我不知道如何以正确的方式平衡我的数据,以便准确地计算多类案例的精度,召回率,准确性和f1得分。因此,我尝试了以下方法: 第一: 第二: 第三: 但是,我收到这样的警告: 如何正确处理我的不平衡数据,以便以正确的方式计算分类器的指标? 问题答案: 我

  • 我使用TensorFlow和数据集实现了一个logistic回归模型。我想出了如何使用以下代码获得学习算法的总精度... 这工作良好,打印精度为91%。现在我正在恢复模型,并将单个图像传递到模型中以进行预测。我传递了一张数字7的图片,,它正确地预测了它->... 现在我想要得到这个预测的准确性与模型的关系,但我不确定如何继续,我尝试了以下显然不起作用的...

  • 原始数据集中正负类不平衡比为1:10,采用过采样的方式处理过,也利用了分层交叉验证、网格搜素调参,最后模型训练精确率为92%,召回率只有69%。如何能提高呢?(特征选择使用卡方检验和随机森林算法进行筛选特征)

  • 我有一些机器学习的结果,我正试图弄明白。任务是预测/标记“爱尔兰人”与“非爱尔兰人”。Python 2.7的输出: 如您所见,准确率和召回率一般,但AUC-ROC较高(~0.90)。我试图找出原因,我怀疑这是由于数据不平衡(大约1:5)。基于混淆矩阵,并使用Irish作为目标(),我计算了TPR=0.51和FPR=0.04。如果我将非爱尔兰人视为(),那么TPR=0.96,FPR=0.49。那么,

  • 刚从ML开始,创建了我的第一个CNN来检测人脸图像的方位。我得到的训练和测试精度高达约96-99%超过2组不同的1000张图片(128x128RGB)。然而,当我自行从测试集中预测一个图像时,模型很少预测正确。我认为在测试和预测期间,我将数据加载到模型中的方式肯定有区别。下面是我如何将数据加载到模型中进行训练和测试: 下面是我如何加载图像来进行预测: ImageDataGenerator处理图像的