当前位置: 首页 > 面试题库 >

Scikit学习:preprocessing.scale()与preprocessing.StandardScalar()

牟恺
2023-03-14
问题内容

我知道缩放表示将均值居中(mean = 0)并使单位方差(variance = 1)。

但是,scikit-
learnpreprocessing.scale(x)preprocessing.StandardScalar()scikit-
learn有什么区别?


问题答案:

这些功能完全相同,但是:

  • preprocessing.scale(x) 只是一个函数,它转换一些数据
  • preprocessing.StandardScaler()是支持 Transformer API 的类 __

即使我不需要inverse_transform和我合作,我也总是会使用后者。受支持StandardScaler()

从文档摘录:

函数刻度提供了一种快速简便的方法来对单个类似数组的数据集执行此操作

预处理模块还提供了一个实用程序类StandardScaler,该类实现了Transformer
API,以计算训练集上的均值和标准差,以便以后能够在测试集上重新应用相同的变换。因此,该类适用于sklearn.pipeline.Pipeline的早期步骤



 类似资料:
  • 从sklearn加载流行数字数据集。数据集模块,并将其分配给可变数字。 分割数字。将数据分为两组,分别命名为X_train和X_test。还有,分割数字。目标分为两组Y_训练和Y_测试。 提示:使用sklearn中的训练测试分割方法。模型选择;将随机_状态设置为30;并进行分层抽样。使用默认参数,从X_序列集和Y_序列标签构建SVM分类器。将模型命名为svm_clf。 在测试数据集上评估模型的准确

  • 问题内容: 在选择主成分数(k)时,我们选择k为最小值,以便保留例如99%的方差。 但是,在Python Scikit学习中,我不是100%确定等于“保留了99%的方差”吗?谁能启发?谢谢。 Python Scikit学习PCA手册在这里 http://scikit- learn.org/stable/modules/generation/sklearn.decomposition.PCA.htm

  • 问题内容: 我正在尝试为我的大型不平衡数据集创建N个平衡随机子样本。有没有一种方法可以简单地通过scikit-learn / pandas来做到这一点,或者我必须自己实现它?任何指向此功能的代码的指针? 这些子样本应该是随机的,并且在我将每个样本送入非常大的分类器集合中的各个分类器时可以重叠。 在Weka中,有一个名为spreadsubsample的工具,在sklearn中是否有等效工具? htt

  • 我正在使用scikit-learn 0.14的GridSearchCV,但总是得到以下警告: /Library/Frameworks/epd 64 . framework/Versions/7.2/lib/python 2.7/site-packages/sk learn/grid _ search . py:706:deprecation warning:忽略GridSearchCV的附加参数!

  • 问题内容: 我正在处理不平衡的数据集,并希望使用scikit的gridsearchcv进行网格搜索以调整模型的参数。为了对数据进行超采样,我想使用SMOTE,我知道我可以将其作为管道的一个阶段,并将其传递给gridsearchcv。我担心的是,我认为训练和验证折纸都将使用击打,这不是您应该做的。验证集不应过采样。我是否正确,整个管道将应用于两个数据集拆分?如果是的话,我该如何扭转呢?在此先多谢 问

  • 问题内容: 使用train_test_split()时如何获取数据的原始索引? 我所拥有的是以下 但这并没有给出原始数据的索引。一种解决方法是将索引添加到数据(例如),然后将其传递到内部,然后再次扩展。有没有更清洁的解决方案? 问题答案: Scikit learning在Pandas上的表现非常好,因此我建议您使用它。这是一个例子: 您可以直接在DataFrame / Series上调用任何sci

  • 先决条件 Numpy, Scipy IPython matplotlib scikit-learn (http://scikit-learn.org) 警告:从版本0.9(在2011年9月发布)起,scikit-learn导入路径从scikits.learn 改为 sklearn 3.5.1 加载样例数据集 首先,我们将加载一些数据来玩玩。我们将使用的数据是知名的非常简单的花数据鸢尾花数据集。 我

  • Scikit-learn 套件的安装 目前Scikit-learn同时支持Python 2及 3,安装的方式也非常多种。对于初学者,最建议的方式是直接下载 Anaconda Python (https://www.continuum.io/downloads)。同时支持 Windows / OSX/ Linux 等作业系统。相关数据分析套件如Scipy, Numpy, 及图形绘制库 matplot