当前位置: 首页 > 面试题库 >

预测sklearn中的训练数据

连正信
2023-03-14
问题内容

我像这样使用scikit-learn的SVM:

clf = svm.SVC()
clf.fit(td_X, td_y)

我的问题是,当我使用分类器预测训练集成员的班级时,即使在scikit-
learns实现中,分类器也可能是错误的。(例如clf.predict(td_X[a])==td_Y[a]


问题答案:

是的,可以运行以下代码,例如:

from sklearn import svm
import numpy as np
clf = svm.SVC()
np.random.seed(seed=42)
x=np.random.normal(loc=0.0, scale=1.0, size=[100,2])
y=np.random.randint(2,size=100)
clf.fit(x,y)
print(clf.score(x,y))

分数是0.61,因此将近40%的训练数据被错误分类。部分原因是,即使默认内核是'rbf'(理论上也应该能够对任何训练数据集进行完美分类,只要您没有两个带有不同标签的相同训练点),也可以进行正则化以减少过度拟合。默认的正则化器为C=1.0

如果您运行与上述相同的代码,但切换clf = svm.SVC()clf = svm.SVC(C=200000),则精度为0.94。



 类似资料:
  • 问题内容: 因此,我对此有疑问,一直在寻找答案。所以问题是我何时使用 这之后,我将训练和测试模型(,作为特征,如标签),并得到一些准确度得分。现在我的疑问是,当我必须预测新数据集的标签时会发生什么。说, 因为当我规范化列时,和的值将根据新数据而不是将在其上训练模型的数据来更改。因此,现在将是下面的数据准备步骤之后的数据。 的价值和将关于改变和价值。的数据准备是关于的。 有关不同数字的数据准备如何有

  • 为了评估我们的监督模型的泛化能力,我们可以将数据分成训练和测试集: from sklearn.datasets import load_iris iris = load_iris() X, y = iris.data, iris.target 考虑如何正常执行机器学习,训练/测试分割的想法是有道理的。真实世界系统根据他们拥有的数据进行训练,当其他数据进入时(来自客户,传感器或其他来源),经过训

  • 问题内容: 我一直在尝试使用Google发布的经过预先训练的inception_resnet_v2模型。我正在使用他们的模型定义(https://github.com/tensorflow/models/blob/master/slim/nets/inception_resnet_v2.py)和给定的检查点(http://download.tensorflow.org/models/incepti

  • 我是CNN的新手,我正在尝试使用CIFAR-10数据集训练分类器。我遵循Pjreddie的教程来训练10类数据集的简单分类器。 我使用下面的代码训练模型,得到了cifar\U small。权重,我后来将其用于检测 在训练了简单的网络之后,我尝试使用cifar\U small进行检测。cfg和cifar\U小型。重量 层过滤器大小输入输出 0 conv 32 3 x 3/1 28 x 28 x 3-

  • 本文向大家介绍python PyTorch预训练示例,包括了python PyTorch预训练示例的使用技巧和注意事项,需要的朋友参考一下 前言 最近使用PyTorch感觉妙不可言,有种当初使用Keras的快感,而且速度还不慢。各种设计直接简洁,方便研究,比tensorflow的臃肿好多了。今天让我们来谈谈PyTorch的预训练,主要是自己写代码的经验以及论坛PyTorch Forums上的一些回

  • 我正在使用alturos.yolo,自动配置alturos.yolov2tinyvocdata。但我想用Yolov3更改为手动配置。 我尝试了在https://github.com/alturosdestinations/alturos.yolo中使用guide预训练的数据集,但它仍然不起作用。 我的代码: