当前位置: 首页 > 知识库问答 >
问题:

利用边性质在spark-graphx中遍历图

令狐高洁
2023-03-14

我希望有人能对以下问题提出一些建议,我最近在类似的问题上得到了很大的帮助,并想进一步讨论它。

我目前有一个使用graphx构建的网络,如下所示(只有更多的顶点和边)

1002,1,0

1003,2,1

1004、3、2

1003、1004、7

1004、1005、3

1002、1006、5

    null

共有1个答案

苏浩瀚
2023-03-14

如果我错了,请纠正我,你想找到图中所有的连通组件吗?(图中的连通组件)如果是这样,GraphX已经有了解决这类问题的算法-参见文档

 类似资料:
  • 我想知道是否有人能帮我,我遇到了一个问题,在spark中为graphx编写的函数,如果我有没有边的顶点,它总是给出错误消息。

  • 主要内容:1.PageRank,2.Pregel1.PageRank 历史上,PageRank算法作为计算互联网网页重要度的算法被提出。PageRank是定义在网页集合上的一个函数,它对每个网页给出一个正实数,表示网页的重要程度,整体构成一个向量,PageRank值越高,网页就越重要,在互联网搜索的排序中可能就被排在前面。 直观上,一个网页,如果指向该网页的超链接越多,随机跳转到该网页的概率也就越高,该网页的PageRank值就越高,这个网页也

  • 主要内容:1.基本概念,2.GraphX简介,3.创建Graph 对象,4.Graph Api1.基本概念 图(Graph)由顶点(Vertex)和边(Edge)组成 图根据边是否有方向,可以分为有向图和无向图 有环图和无环图: 2.GraphX简介 SparkGraphX是Spark提供的分布式图计算API,通过弹性分布式属性图(Property Graph)统一了图试图和表视图,可以与Spark Streaming、Spark SQL和Spark MLlib无缝衔接。 对graph视图

  • 我对Gremlin还比较陌生,我所在的公司正在寻求实现一个带有一些临时边缘的图形数据库。每个顶点可以有一条或多条边,每条边上都有一个本质上是即时真/假的属性。 当遍历图时,如果“isTemporary”=true,我们应该遵循该边,否则我们应该遵循“isTemporary”=false的边。 即。,

  • 我对Spark很陌生,不太了解基础知识,我只是为了解决一个问题而跳入其中。该问题的解决方案包括制作一个边具有字符串属性的图(使用GraphX)。用户可能希望查询这个图,我通过只过滤那些具有字符串属性的边来处理查询,该属性等于用户的查询。 现在,我的图形有超过1600万条边;当我使用计算机的所有8个核心时,创建图形需要10分钟以上。然而,当我查询这个图时(就像我上面提到的那样),我会立即得到结果(令