当前位置: 首页 > 知识库问答 >
问题:

其他RDD中的Java Spark RDD?

宓季同
2023-03-14

我尝试创建一个JavaRDD,其中包含另一系列RDD。

RDD机器。foreach(机器-

第一:有没有可能这样做?如果没有,我可以用什么方式尝试做一些不同的事情?

让我展示一下我尝试做的事情:

        SparkConf conf = new SparkConf().setAppName("Algo").setMaster("local");
    conf.set("es.index.auto.create", "true");
    conf.set("es.nodes", "IP_ES");
    conf.set("es.port", "9200");
    sparkContext = new JavaSparkContext(conf);

    MyAlgoConfig config_algo = new MyAlgoConfig(Detection.byPrevisionMerge);

    Machine m1 = new Machine("AL-27", "IP1", config_algo);
    Machine m2 = new Machine("AL-20", "IP2", config_algo);
    Machine m3 = new Machine("AL-24", "IP3", config_algo);
    Machine m4 = new Machine("AL-21", "IP4", config_algo);

    ArrayList<Machine> Machines = new ArrayList();
    Machines.add(m1);
    Machines.add(m2);
    Machines.add(m3);
    Machines.add(m4);

    JavaRDD<Machine> machineRDD = sparkContext.parallelize(Machines);

    machineRDD.foreach(machine -> machine.startDetectNow());

我尝试在每台机器上启动我的算法,这台机器必须从Elasticsearch中的数据中学习。

    public boolean startDetectNow()


    // MEGA Requete ELK
    JavaRDD dataForLearn = Elastic.loadElasticsearch(
            Algo.sparkContext
            , "logstash-*/Collector"
            , Elastic.req_AvgOfCall(
                    getIP()
                    , "hour"
                    , "2016-04-16T00:00:00"
                    , "2016-06-10T00:00:00"));

    JavaRDD<Hit> RDD_hits = Elastic.mapToHit(dataForLearn);
    List<Hit> hits = Elastic.RddToListHits(RDD_hits);

因此,我尝试在每个“机器”中获取查询的所有数据。我的问题是:Spark有可能做到这一点吗?或者以其他方式?当我点燃它时;当代码在第二个RDD附近时,它就像锁一样。

错误消息为:

谢谢你能给我一些建议。

共有1个答案

哈骞仕
2023-03-14

无论RDD的类型是什么,都不能在RDD中创建RDD。这是第一条规则。这是因为RDD是指向数据的抽象。

 类似资料:
  • 从Sandy Ryza的存储库中粘贴代码,以确保我没有输入错误(如下),并得到一个运行时错误,其中作业停止并产生以下错误。 请注意,如果我有任何其他简单的RDD,所有这些操作都可以正常工作--似乎只有medline数据有问题。 https://github.com/sryza/aas/blob/master/ch07-graph%2fsrc%2fmain%2fscala%2fcom%2fcloud

  • 问题内容: 我有两个班,并有一个互相一一对应关系。这是它们的注释方式。 如您所见,是关系的所有者,并且是此双向关系的另一端。InvitedTech也与 Now 有关系,当我编写一个简单查询以获取所有排期时,它总共触发三个查询。第一个让我得到结果,但是触发了另外两个查询。 查询所有航班(这是我唯一需要的航班) 通过InvitedTech和Flight之间的联接进行查询 在被邀请的科技公司和酒店之间进

  • 小编在整理当前开源书籍项目的时候,发现项目有部分章节内容没有编排进summary.md里面,但是小编又不知道该将这些内容放到哪里。所以,直接建了个其他的章节,把这些内容放这里来。 Worker节点负载均衡 强制平衡 强行移除节点 Manager节点配置静态IP地址 分布式manager节点 Manager节点的故障排查 监控Swarm健康 备份 检查Swarm中service的状态

  • Task Scheduling  任务 Angular: Why TypeScript? 测试组件 回顾 Reducers 和纯函数 Redux和组件架构 配置应用以使用Redux 插件 使用RxJS操作符实现更多高级特性 与其他框架比较 Angular 2中的Web辅助功能 无障碍Web应用的关键

  • 其他 如果需要 CSS Hacks,需详细注明解决什么问题。 尽量避免使用 IE 中的 CSS filters。 font-weight普通字重使用normal,加粗使用bold。大部分字体只有两个字重,所以 不建议使用容易混淆的数值表示方法。 如无特别精确的要求,推荐使用不带单位的line-height,这样当前元素的行高只与自身font-size成比例关系,使排版更加灵活。例如line-hei

  • 其他 总是开启 ruby -w 选项,以编写安全的代码。 避免使用哈希作为可选参数。这个方法是不是做太多事了?(对象构造器除外) 避免单个方法的长度超过 10 行(不计入空行)。理想上,大部分方法应当不超过 5 行。 避免参数列表数目多于三或四个。 如果你真的需要“全局”方法,将它们添加到 Kernel 并设为私有。 使用模块实例变量而不是全局变量。 # 差 $foo_bar = 1 # 好 mo