当前位置：首页 > 面试题库 >

预测sklearn中的训练数据

连正信

2023-03-14

问题内容：

我像这样使用scikit-learn的SVM：

clf = svm.SVC()
clf.fit(td_X, td_y)

我的问题是，当我使用分类器预测训练集成员的班级时，即使在scikit-
learns实现中，分类器也可能是错误的。（例如clf.predict(td_X[a])==td_Y[a]）

问题答案：

是的，可以运行以下代码，例如：

from sklearn import svm
import numpy as np
clf = svm.SVC()
np.random.seed(seed=42)
x=np.random.normal(loc=0.0, scale=1.0, size=[100,2])
y=np.random.randint(2,size=100)
clf.fit(x,y)
print(clf.score(x,y))

分数是0.61，因此将近40％的训练数据被错误分类。部分原因是，即使默认内核是'rbf'（理论上也应该能够对任何训练数据集进行完美分类，只要您没有两个带有不同标签的相同训练点），也可以进行正则化以减少过度拟合。默认的正则化器为C=1.0。

如果您运行与上述相同的代码，但切换clf = svm.SVC()到 clf = svm.SVC(C=200000)，则精度为0.94。

类似资料：

如何使用MinMaxScaler sklearn归一化训练和测试数据

问题内容：因此，我对此有疑问，一直在寻找答案。所以问题是我何时使用这之后，我将训练和测试模型（，作为特征，如标签），并得到一些准确度得分。现在我的疑问是，当我必须预测新数据集的标签时会发生什么。说，因为当我规范化列时，和的值将根据新数据而不是将在其上训练模型的数据来更改。因此，现在将是下面的数据准备步骤之后的数据。的价值和将关于改变和价值。的数据准备是关于的。有关不同数字的数据准备如何有
四、训练和测试数据

为了评估我们的监督模型的泛化能力，我们可以将数据分成训练和测试集： from sklearn.datasets import load_iris iris = load_iris() X, y = iris.data, iris.target 考虑如何正常执行机器学习，训练/测试分割的想法是有道理的。真实世界系统根据他们拥有的数据进行训练，当其他数据进入时（来自客户，传感器或其他来源），经过训
在Tensorflow中使用预训练的inception_resnet_v2

问题内容：我一直在尝试使用Google发布的经过预先训练的inception_resnet_v2模型。我正在使用他们的模型定义（https://github.com/tensorflow/models/blob/master/slim/nets/inception_resnet_v2.py）和给定的检查点（http://download.tensorflow.org/models/incepti
使用暗网训练后获得预测

我是CNN的新手，我正在尝试使用CIFAR-10数据集训练分类器。我遵循Pjreddie的教程来训练10类数据集的简单分类器。我使用下面的代码训练模型，得到了cifar\U small。权重，我后来将其用于检测在训练了简单的网络之后，我尝试使用cifar\U small进行检测。cfg和cifar\U小型。重量层过滤器大小输入输出 0 conv 32 3 x 3/1 28 x 28 x 3-
python PyTorch预训练示例

本文向大家介绍python PyTorch预训练示例，包括了python PyTorch预训练示例的使用技巧和注意事项，需要的朋友参考一下前言最近使用PyTorch感觉妙不可言，有种当初使用Keras的快感，而且速度还不慢。各种设计直接简洁，方便研究，比tensorflow的臃肿好多了。今天让我们来谈谈PyTorch的预训练，主要是自己写代码的经验以及论坛PyTorch Forums上的一些回
如何在C#alturos.yolo中预训练数据集YOLOv3

我正在使用alturos.yolo，自动配置alturos.yolov2tinyvocdata。但我想用Yolov3更改为手动配置。我尝试了在https://github.com/alturosdestinations/alturos.yolo中使用guide预训练的数据集，但它仍然不起作用。我的代码：

相关阅读

检测20类物体，多少张训练集，怎么训练 Pytorch加载部分预训练模型的参数实例 scikit-learn中的分层训练/测试拆分 NLTK punkt的训练数据格式如何在Keras中使用训练有素的模型预测输入图像？

相关文章

神经网络训练的建议得物训练营Java后端面试招行fintech训练营产品面试招行fintech训练营产品赛道面经 golang实习生训练营-效率工程（凉经）

相关问答

使用OpenVino预训练模型与AWS Sagemaker autoarima训练和测试，按r中的id分组在训练和测试数据中保持相同的虚拟变量用预定义的字体图像训练“Tesseract OCR”在keras中的预训练密集层之间添加dropout层

相关工具

auto-sklearn Sklearn-pandas sklearn-evaluation Hyperopt-sklearn Google Android 官方培训课程中文版

相关文档

SciPyCon 2018 sklearn 教程 scikit-learn (sklearn) 官方文档中文版 Sklearn 与 TensorFlow 机器学习实用指南毫末科技培训资料 Sklearn 与 TensorFlow 机器学习实用指南第二版