当前位置: 首页 > 知识库问答 >
问题:

我们如何在Apache Spark中使用多个Cassandra设置?

邹玄裳
2023-03-14

我在两台不同的机器上有两种不同的卡桑德拉设置。我试图从一台机器上读取数据,使用Spark进行处理,然后将结果写入第二个设置。我使用的是spark-cassandra-connector-java_2.10。当我尝试使用Java函数时。writeBuilder,它允许我指定键空间和表名,但Cassandra主机是从Spark上下文获取的。除了Spark上下文中提到的方法外,还有其他方法可以将数据写入Cassandra设置吗?如何覆盖此默认设置?

共有1个答案

祁凯泽
2023-03-14

使用以下代码

SparkConf confForCassandra = new SparkConf().setAppName("ConnectToCassandra")
                .setMaster("local[*]")
                .set("spark.cassandra.connection.host", "<cassandraHost>");

CassandraConnector connector = CassandraConnector.apply(confForCassandra);

javaFunctions(rdd).writerBuilder("keyspace", "table", mapToRow(Table.class)).withConnector(connector).saveToCassandra();
 类似资料:
  • 我是Android新手,我正在尝试使用UI线程,所以我写了一个简单的测试活动。但我想我误解了什么,因为点击按钮,应用程序不再响应

  • 问题内容: 在以前的版本中,我可以这样做: 但是自从更新以来,typeahead.js要求我们定义我无法使之工作的内容。如何定义远程而不需要定义数据集功能? 问题答案: Typeahead.js版本0.10.0现在使用称为建议引擎的单独组件来提供建议数据。Typeahead.js附带的建议引擎称为Bloodhound。 因此,您不能“无需定义数据集函数即可定义远程”。 可以在以下位置找到使用远程数

  • 问题内容: 我想在colab.research.google.com中使用Chrome的Selenium Webdriver进行快速处理。我可以使用安装Selenium,但chrome的webdriver需要通向webdriverChrome.exe的路径。我应该如何使用它? PS- colab.research.google.com是一个在线平台,可为与深度学习相关的快速计算问题提供GPU。请避

  • 我是JSP新手。尝试了很多事情都无济于事。请帮助我知道这段代码中可能出现的问题是什么? List rulesList=(List)request.getattribute(“List”); request.setattribute(“rulesList”,rulesList); String rowCount=(String)Request.GetAttribute(“rows”); Reques

  • 我使用cassandra作为web应用程序(java)的后端,每个用户都需要创建唯一的会话,或者使用下面url中的单个会话? 我在这个链接中阅读了会话信息。https://docs.datastax.com/en/drivers/java/2.0/com/datastax/driver/core/Session.html 它说会话实例是线程安全的。意味着一次一个线程可以使用这个实例。 还写到,每个

  • 我是一个学习Kafka的新学生,我遇到了一些关于理解多个消费者的基本问题,到目前为止,文章、文档等都没有太大的帮助。 我尝试做的一件事是编写我自己的高级Kafka生产者和消费者,并同时运行他们,发布100个简单的消息到一个主题,并让我的消费者检索他们。我成功地做到了这一点,但是当我试图引入第二个消费者来消费刚刚发布消息的同一主题时,它没有收到任何消息。 我的理解是,对于每个主题,您可以有来自不同消