我通常会这样PCA
加载:
pca = PCA(n_components=2)
X_t = pca.fit(X).transform(X)
loadings = pca.components_
如果我PCA
使用scikit-learn
油管跑…
from sklearn.pipeline import Pipeline
pipeline = Pipeline(steps=[
('scaling',StandardScaler()),
('pca',PCA(n_components=2))
])
X_t=pipeline.fit_transform(X)
…是否有可能获得装载量?
简单尝试loadings = pipeline.components_
失败:
AttributeError: 'Pipeline' object has no attribute 'components_'
谢谢!
(也有兴趣coef_
从学习管道中提取属性。)
您是否看过以下文档:http :
//scikit-learn.org/dev/modules/pipeline.html 我觉得这很清楚。
更新:在0.21中,您可以仅使用方括号:
pipeline['pca']
或索引
pipeline[1]
有两种方法可以到达管道中的步骤,或者使用索引,也可以使用您提供的字符串名称:
pipeline.named_steps['pca']
pipeline.steps[1][1]
这将为您提供PCA对象,您可以在该对象上获取组件。通过,named_steps
您还可以将属性访问与一起使用.
,以允许自动补全:
pipe.names_steps.pca。
scikit-learn 是一个 Python 的机器学习项目。是一个简单高效的数据挖掘和数据分析工具。基于 NumPy、SciPy 和 matplotlib 构建。 Installation 依赖 scikit-learn 要求: Python (>= 2.7 or >= 3.3) NumPy (>= 1.8.2) SciPy (>= 0.13.3) 运行示例需要 Matplotlib >= 1
Introduction to Machine Learning with scikit-learn This video series will teach you how to solve Machine Learning problems using Python's popular scikit-learn library. There are 10 video tutorials tot
你可以使用 Keras 的 Sequential 模型(仅限单一输入)作为 Scikit-Learn 工作流程的一部分,通过在此找到的包装器: keras.wrappers.scikit_learn.py。 有两个封装器可用: keras.wrappers.scikit_learn.KerasClassifier(build_fn=None, **sk_params), 这实现了Scikit-Le
校验者: @小瑶 翻译者: @片刻 Note 如果你想为这个项目做出贡献,建议你 安装最新的开发版本 . 安装最新版本 Scikit-learn 要求: Python (>= 2.7 or >= 3.3), NumPy (>= 1.8.2), SciPy (>= 0.13.3). 如果你已经有一个安全的 numpy 和 scipy,安装 scikit-learn 最简单的方法是使用 pip pip
分类变量的特征提取 比如城市作为一个特征,那么就是一系列散列的城市标记,这类特征我们用二进制编码来表示,是这个城市为1,不是这个城市为0 比如有三个城市:北京、天津、上海,我们用scikit-learn的DictVector做特征提取,如下: # coding:utf-8 import sys reload(sys) sys.setdefaultencoding( "utf-8" ) from
问题内容: 作为Enron项目的一部分,构建了附件模型,以下是步骤的摘要, 下面的模型给出了很高的分数 下面的模型给出了更多合理但较低的分数 使用Kbest找出分数并对其功能进行排序,并尝试组合较高和较低的分数。 通过StratifiedShuffle将SVM与GridSearch一起使用 使用best_estimator_预测和计算精度和召回率。 问题是估算器会吐出完美分数,在某些情况下为1 但