当前位置: 首页 > 面试题库 >

Python中的主成分分析(PCA)

齐雅畅
2023-03-14
问题内容

我有一个(26424 x
144)数组,我想使用Python在其上执行PCA。但是,网络上没有什么地方可以说明如何完成此任务(有些站点只是根据自己的站点进行PCA,因此无法找到通用的方法)。任何有任何帮助的人都会做得很好。


问题答案:

您可以在matplotlib模块中找到PCA函数:

import numpy as np
from matplotlib.mlab import PCA

data = np.array(np.random.randint(10,size=(10,3)))
results = PCA(data)

结果将存储PCA的各种参数。它来自matplotlib的mlab部分,它是MATLAB语法的兼容性层

编辑:在博客nextgenetics上,我找到了一个精彩的演示,演示如何使用matplotlib
mlab模块执行和显示PCA,玩得开心,并查看该博客!



 类似资料:
  • 问题内容: 我想使用主成分分析(PCA)进行降维。是否已经有numpy或scipy,或者我必须使用自己滚动? 我不只是想使用奇异值分解(SVD),因为我的输入数据具有很高的维数(约460个维数),因此我认为SVD比计算协方差矩阵的特征向量要慢。 我希望找到一个预制的,已调试的实现,该实现已经对何时使用哪种方法以及哪些可能进行的其他优化进行了正确的决策,而这些优化我都不知道。 问题答案: 您可以看看

  • 目录   综述 01 使用梯度上升法求解主成分  demean 梯度上升法 02 获得前n个主成分 03 从高维数据向低维数据的映射 04 scikit-learn中的PCA 05 使用PCA降噪 手写识别例子 人脸识别 06 特征脸 特征脸 综述 “明道若昧;进道若退;夷道若颣;大方无隅;大器免成;大音希声;大象无形。” 本文采用编译器:jupyter   主成分分析 是一个非监督的机器学习算法

  • 1 主成分分析原理   主成分分析是最常用的一种降维方法。我们首先考虑一个问题:对于正交矩阵空间中的样本点,如何用一个超平面对所有样本进行恰当的表达。容易想到,如果这样的超平面存在,那么他大概应该具有下面的性质。 最近重构性:样本点到超平面的距离都足够近 最大可分性:样本点在这个超平面上的投影尽可能分开   基于最近重构性和最大可分性,能分别得到主成分分析的两种等价推导。 1.1 最近重构性   

  • 第十一部分 主成分分析(Principal components analysis) 前面我们讲了因子分析(factor analysis),其中在某个 $k$ 维度子空间对 $x \in R^n$ 进行近似建模,$k$ 远小于 $n$,即 $k \ll n$。具体来说,我们设想每个点 $x^{(i)}$ 用如下方法创建:首先在 $k$ 维度仿射空间(affine space) ${\Lambda

  • 本文向大家介绍Python根据成绩分析系统浅析,包括了Python根据成绩分析系统浅析的使用技巧和注意事项,需要的朋友参考一下 案例:该数据集的是一个关于每个学生成绩的数据集,接下来我们对该数据集进行分析,判断学生是否适合继续深造 数据集特征展示 1.导入包 2.导入并查看数据集 3.查看每个特征的相关性 结论:1.最有可能影响是否读硕士的特征是GRE,CGPA,TOEFL成绩 2.影响相对较小的

  • 本文向大家介绍Python库urllib与urllib2主要区别分析,包括了Python库urllib与urllib2主要区别分析的使用技巧和注意事项,需要的朋友参考一下 作为一个Python菜鸟,之前一直懵懂于urllib和urllib2,以为2是1的升级版。今天看到老外写的一篇《Python: difference between urllib and urllib2》才明白其中的区别 You