Spark-cassandra连接器：选择键列表

邹博明

2023-03-14

Cassandra 2.1,Spark 1.1,Spark-Cassandra-Connector 1.1

import com.datastax.spark.connector._                                    

val ids = ...

val pairs = id.map{
 id => sc.cassandraTable("cf", "tallTable")
        .select("the_key", "the_val")
        .where("the_key = ?", id)
 }

共有1个答案

狄飞尘

2023-03-14

spark-cassandra连接器提供了一种实现RDD键与Cassandra表联接的优化方法：

// Given a collection of ids
val ids = Seq(id,...)
// Make an RDD out of it
val idRdd = sc.parallelize(ids)
// join the ids with the cassandra table to obtain the data specific to those ids
val data = idRDD.joinWithCassandraTable("cf", "tallTable")

这个功能从spark-cassandra connector V1.2开始就可以使用，所以我建议您升级。

类似资料：

Spark Cassandra连接器-perPartitionLimit

注意，这里是每个cassandra分区的限制，而不是每个spark分区的限制（连接器中现有的限制函数支持这一点）。 spark 2.0.1，连接器-2.0.0-M3
Spark cassandra连接器+连接超时

**dataframe2:从另一个来源获得的键的Dataframe（这些键是上表中ID列的分区键）-此表中不同键的数量约为0.15万** 现在，此代码总是导致“com.datastax.oss.driver.api.core.servererrors.ReadFailureException：在一致性LOCAL_ONE读取查询期间Cassandra失败（需要1个响应，但只有0个副本响应，1个失败）
spark-cassandra连接器的Spark cassandra集成错误

我得到了一个错误：- 线程“main”java.lang.nosuchmethoderror：com.datastax.driver.core.queryoptions.setrefreshnodeintervalmillis（I）lcom/datastax/driver/core/queryoptions；**在com.datastax.spark.connector.cql.defaultCo
按分区键的Spark Cassandra连接器查询

使用Spark连接器通过分区键查询cassandra的理想方法是什么。我使用传入键，但这导致cassandra在引擎盖下添加，从而导致超时。当前设置：这里是分区（不是主）键，我有一个复合主键，只使用分区键进行查询更新：是的，我得到了一个异常：
无法使用Spark Cassandra连接器1.5.0连接Cassandra 3.0

问题-无法使用Spark Cassandra连接器1.5.0连接Cassandra 3.0 根据DataStax Spark Cassandra Connector文档，它说Spark Connector 1.5可以从Spark 1.5.0/1.6.0用于Cassandra 3.0。你能告诉我我是不是漏掉了哪一步？尝试的方法在“pom.xml”中添加了单独的番石榴依赖项提前谢了。
带IN子句的Spark Cassandra连接器筛选

我如何指定在Spark中的CQL查询中使用的IN子句？如何还可以指定范围查询？

Spark-cassandra连接器：选择键列表

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档