当前位置: 首页 > 知识库问答 >
问题:

分布式互相关矩阵计算

左华灿
2023-03-14

如何计算大的皮尔逊互相关矩阵(

更新:我读了阿帕奇火花的实现

Pearson Computaation:
/home/d066537/codespark/spark/mllib/src/main/scala/org/apache/spark/mllib/stat/correlation/Correlation.scala
Covariance Computation:
/home/d066537/codespark/spark/mllib/src/main/scala/org/apache/spark/mllib/linalg/distributed/RowMatrix.scala

但对我来说,看起来所有的计算都发生在一个节点上,而不是真正意义上的分布式。

请在这里放一些光。我还尝试在3节点火花群集上执行它,下面是屏幕截图:

正如您从第二张图中看到的,数据在一个节点上被拉起,然后进行计算。我在这里对吗?

共有2个答案

高朝明
2023-03-14

每个本地数据集都可以转换为标准和协方差。标准和协方差和也构成相关性。

这是工作的例子https://github.com/jeesim2/distributed-correlation

督宏旷
2023-03-14

首先,看看这个,看看事情是否进展顺利。然后,您可以参考这些实现中的任何一个:MPI/OpenMP:Agomezl或Meismyles,MapReduce:Vangjee或Seawolf42。在继续之前阅读这篇文章也会很有趣。另一方面,如果您对计算对异常值具有鲁棒性的相关性感兴趣,詹姆斯的论文提供了一些指针。

 类似资料:
  • 我有两个列表,每个列表中有两个矩阵。。是否有一种方法可以对它们进行矩阵计算,即相加,其中matrix1中的蓝色矩阵与matrix2中的蓝色矩阵相加,matrix1中的红色矩阵与matrix2中的红色矩阵相加。我能想到的唯一方法是在循环中进行计算 请注意,我将有大约10个,以及不止一组(即蓝色、红色、绿色、紫色)

  • 我有一个矩阵。只有唯一的颜色以不同的权重重复它们自己。从它们中,我得选择一半,另一半必须用从第一个中最接近的元素替换。 我想到了在图像中循环,并搜索最近的颜色为当前的一个。找到后,我把一个换成另一个。 但我有3个循环、、。前两个I循环通过RGB矩阵,第三个用于循环到包含最终颜色的矩阵。这需要一些时间来计算。 可以做些什么来加快它的速度? 循环如下所示: 表示选择为最终颜色的半色。 我可以考虑一些小

  • 问题内容: 在中,我使用或计算成对互相关函数,以便找出哪个偏移使我获得了最大值。从它的外观来看,给了我一个规范化的值序列。Python的scipy中是否有类似的东西,还是应该使用该模块?目前,我正在执行以下操作: 问题答案: 要使一维数组互相关,请使用numpy.correlate。 对于2d数组,请使用scipy.signal.correlate2d。 还有scipy.stsci.convolv

  • 本章节主要给大家引入视图矩阵和投影矩阵两个新的概念,如果你没有图形学基础,对这两个概念暂时还没有认知,也没有关系。通过前面的学习相信你对平移、旋转等矩阵有了一定的认知,至于投影和视图矩阵和平移、旋转等模型矩阵一样也会对WebGL顶点进行坐标变换,至于如何变换下面会逐步讲解。 在学习本章节之前,如果你对Three.js已经有了一定的了解,可以尝试从WebGL视图矩阵和投影矩阵的角度去深入理解Thre

  • 本文向大家介绍C语言科学计算入门之矩阵乘法的相关计算,包括了C语言科学计算入门之矩阵乘法的相关计算的使用技巧和注意事项,需要的朋友参考一下 1.矩阵相乘 矩阵相乘应满足的条件: (1) 矩阵A的列数必须等于矩阵B的行数,矩阵A与矩阵B才能相乘; (2) 矩阵C的行数等于矩阵A的行数,矩阵C的列数等于矩阵B的列数; (3) 矩阵C中第i行第j列的元素等于矩阵A的第i行元素与矩阵B的第j列元素对应乘积

  • 问题内容: 我正在尝试计算Java中的逆矩阵。 我遵循伴随方法(首先计算伴随矩阵,然后转置该矩阵,最后将其乘以行列式值的倒数)。 当矩阵不太大时有效。我检查过,对于尺寸最大为12x12的矩阵,可以快速提供结果。但是,当矩阵大于12x12时,完成计算所需的时间呈指数增长。 我需要反转的矩阵是19x19,并且花费太多时间。消耗更多时间的方法是用于行列式计算的方法。 我使用的代码是: 有人知道如何更有效