当前位置: 首页 > 知识库问答 >
问题:

Cassandra-Hive集成

艾奕
2023-03-14

集成Cassandra和Hive的最佳实践是什么?

关于堆栈溢出(卡桑德拉和蜂巢)的一个老问题指向轻快,它现在已经成为仅限订阅的Datastax企业产品。

谷歌搜索只指向两个未解决的jira问题,

  • https://issues.apache.org/jira/browse/CASSANDRA-4131
  • https://issues.apache.org/jira/browse/HIVE-1434

但它们都没有导致在两个项目中的一个项目中提交任何代码。

集成卡桑德拉和蜂巢修补卡桑德拉/蜂巢源代码的唯一方法是什么?您在堆栈中使用哪种解决方案

共有3个答案

巫马安怡
2023-03-14

这是一个git de 卡桑德拉蜂巢驱动程序与卡桑德拉 2.0 和 hadoop 2, https://github.com/2013Commons/hive-cassandra

和其他卡桑德拉1.2

https://github.com/dvasilen/Hive-Cassandra/tree/HIVE-0.11.0-HADOOP-2.0.0-CASSANDRA-1.2.9

戚奇略
2023-03-14

目前由Datastax维护的Hive开源Cassandra Storage Handler。

法弘壮
2023-03-14

一个月前我做了同样的研究,得出了同样的结论。Brisk不再作为社区下载提供,除了修补卡桑德拉/Hive代码之外,在卡桑德拉数据库中抛出地图/减少作业的唯一方法是使用DSE - Datastax企业版,我相信除了生产集群之外,它对任何用途都是免费的。

你可以看看基于HDFS的HBase。

 类似资料:
  • 我引用了这个git项目来使用配置单元表集成cassandra数据,我将适当的cassandra JAR复制到配置单元库文件夹中,但是在运行对cassandra的查询时,我得到了以下错误,请帮助我解决它。 https://github.com/milliondreams/hive/tree/cas-support-cql/cassandra-handler HIVE>创建外部表消息(row_key字

  • Hive 提供了 streaming API, 它允许将数据连续地写入 Hive. 传入的数据可以用小批量 record 的方式连续提交到现有的 Hive partition 或 table 中. 一旦提交了数据,它就可以立即显示给所有的 hive 查询. 有关 Hive Streaming API 的更多信息请参阅 https://cwiki.apache.org/confluence/disp

  • Apache Cassandra 的 Bolt API 实现 这个库提供了 Apache Cassandra 之上的核心 storm bolt . 提供简单的 DSL 来 map storm Tuple 到 Cassandra Query Language Statement (Cassandra 查询语言 Statement). Configuration (配置) 以下属性可能会传递给 sto

  • 主要内容:Set集合,List集合,Map集合Cassandra集合用于处理任务。 您可以在集合中存储多个元素。 Cassandra支持三种类型的集合: Set List Map Set集合 Set集合存储查询时返回排序元素的元素组。 语法: 示例: 下面举个例子来展示集合。创建一个具有三列(, 和 )的表“”。 执行上面语句创建表以后如下: 现在,向上面创建的表中插入一些值: 执行上面语句结果如下 - List集合 当元素的顺序重要时,使用

  • 我得到了一个错误:- 线程“main”java.lang.nosuchmethoderror:com.datastax.driver.core.queryoptions.setrefreshnodeintervalmillis(I)lcom/datastax/driver/core/queryoptions;**在com.datastax.spark.connector.cql.defaultCo

  • 我有一个由4个节点组成的Cassandra(2.2.1)集群,由Java客户端应用程序使用。复制因子为3,读写的一致性级别为LOCAL_QUORUM。每个节点大约有5 GB的数据。请求量约为每秒2-4k。几乎没有删除操作,因此创建了少量的墓碑。 一段时间前,我注意到读写性能很差,而且随着时间的推移,性能越来越差——集群变得非常慢。读取(通常)和写入超时已变得非常频繁。硬件不应该引起问题,部署集群的