我想使用主成分分析(PCA)进行降维。是否已经有numpy或scipy,或者我必须使用自己滚动numpy.linalg.eigh
?
我不只是想使用奇异值分解(SVD),因为我的输入数据具有很高的维数(约460个维数),因此我认为SVD比计算协方差矩阵的特征向量要慢。
我希望找到一个预制的,已调试的实现,该实现已经对何时使用哪种方法以及哪些可能进行的其他优化进行了正确的决策,而这些优化我都不知道。
您可以看看MDP。
我没有机会亲自对其进行测试,但是我已将其标记为完全适用于PCA功能。
问题内容: 我有一个(26424 x 144)数组,我想使用Python在其上执行PCA。但是,网络上没有什么地方可以说明如何完成此任务(有些站点只是根据自己的站点进行PCA,因此无法找到通用的方法)。任何有任何帮助的人都会做得很好。 问题答案: 您可以在matplotlib模块中找到PCA函数: 结果将存储PCA的各种参数。它来自matplotlib的mlab部分,它是MATLAB语法的兼容性层
目录 综述 01 使用梯度上升法求解主成分 demean 梯度上升法 02 获得前n个主成分 03 从高维数据向低维数据的映射 04 scikit-learn中的PCA 05 使用PCA降噪 手写识别例子 人脸识别 06 特征脸 特征脸 综述 “明道若昧;进道若退;夷道若颣;大方无隅;大器免成;大音希声;大象无形。” 本文采用编译器:jupyter 主成分分析 是一个非监督的机器学习算法
1 主成分分析原理 主成分分析是最常用的一种降维方法。我们首先考虑一个问题:对于正交矩阵空间中的样本点,如何用一个超平面对所有样本进行恰当的表达。容易想到,如果这样的超平面存在,那么他大概应该具有下面的性质。 最近重构性:样本点到超平面的距离都足够近 最大可分性:样本点在这个超平面上的投影尽可能分开 基于最近重构性和最大可分性,能分别得到主成分分析的两种等价推导。 1.1 最近重构性
第十一部分 主成分分析(Principal components analysis) 前面我们讲了因子分析(factor analysis),其中在某个 $k$ 维度子空间对 $x \in R^n$ 进行近似建模,$k$ 远小于 $n$,即 $k \ll n$。具体来说,我们设想每个点 $x^{(i)}$ 用如下方法创建:首先在 $k$ 维度仿射空间(affine space) ${\Lambda
1.3.4 Python 语言的基本成分 在自然语言中,我们用字词、句子、段落来写文章表达思想。类似地,编程语言也提供 各种语言成分用于构造程序表达计算。例如 HelloWorld 程序中的 print 是 Python 语言中用 于显示输出的一个保留词,而"Hello, World!"则是被显示的数据,这两个成分组合在一 起,就构成了一条完整的语句。本节简单介绍 Python 语言的基本成分,使
问题内容: 将列表基于任意数量的索引分成多个部分的最佳方法是什么?例如给出下面的代码 返回这样的东西 如果没有索引,则应返回整个列表。 问题答案: 这是我能想到的最简单,最pythonic的解决方案: 如果输入很大,则迭代器解决方案应该更方便: 当然,这是一个非常懒惰的家伙解决方案(如果您不介意获取数组而不是列表,但是无论如何,您始终可以将它们还原为列表):