当前位置: 首页 > 知识库问答 >
问题:

使用CqlStorageHandler集成Hive和Cassandra

艾修筠
2023-03-14

我引用了这个git项目来使用配置单元表集成cassandra数据,我将适当的cassandra JAR复制到配置单元库文件夹中,但是在运行对cassandra的查询时,我得到了以下错误,请帮助我解决它。

https://github.com/milliondreams/hive/tree/cas-support-cql/cassandra-handler

HIVE>创建外部表消息(row_key字符串、col1字符串、col2字符串)

STORED BY 'org.apache.hadoop.hive.cassandra.cql.CqlStorageHandler' WITH SERDEPROPERTIES("cql.primarykey" = "row_key")
TBLPROPERTIES ("cassandra.ks.name" = "mycqlks", "cassandra.ks.stratOptions"="'DC':1, 'DC2':1",
"cassandra.ks.strategy"="NetworkTopologyStrategy");

共有1个答案

耿和韵
2023-03-14

你用的是哪个版本的hive?

根据https://github.com/milliondreams/hive/tree/cas-support-cql/cassandra-handler,它必须是配置单元0.9

我认为您使用的是版本>=0.11.0

版本:http://svn.apache.org/repos/asf/hive/tags/release-0.10.0/metaxore/src/java/org/apache/hadoop/hive/metaxore/metaxoreutils.java

版本:http://svn.apache.org/repos/asf/hive/tags/release-0.11.0/metaxore/src/java/org/apache/hadoop/hive/metaxore/metaxoreutils.java

0.11.0中缺少单参数方法-org.apache.hadoop.hive.metastore.metastoreutils.GetSchema

 类似资料:
  • 集成Cassandra和Hive的最佳实践是什么? 关于堆栈溢出(卡桑德拉和蜂巢)的一个老问题指向轻快,它现在已经成为仅限订阅的Datastax企业产品。 谷歌搜索只指向两个未解决的jira问题, https://issues.apache.org/jira/browse/CASSANDRA-4131 https://issues.apache.org/jira/browse/HIVE-1434

  • Hive 提供了 streaming API, 它允许将数据连续地写入 Hive. 传入的数据可以用小批量 record 的方式连续提交到现有的 Hive partition 或 table 中. 一旦提交了数据,它就可以立即显示给所有的 hive 查询. 有关 Hive Streaming API 的更多信息请参阅 https://cwiki.apache.org/confluence/disp

  • 我已经在jenkins和ZAPI安装了Zephyr插件,在jira安装了Zephyr插件,并且能够建立连接 但是在下拉列表中我无法查看jira项目 有人能帮我解决这个问题吗?在构建后无法在下拉列表中查看项目名称

  • 1.云原生架构 Kubernetes在计算节点上弹性地管理无状态的Spark和Hive容器。Spark具有与Kubernetes的本机调度程序集成。由于传统原因,Hive在Kubernetes上使用YARN调度程序。 通过S3 / SQL SELECT API对MinIO对象存储的所有访问。除了计算节点外,Kubernetes还将MinIO容器作为有状态容器进行管理,其状态存储(JBOD / JB

  • 我有什么选择?我如何使用他们的SDK的更新版本来实现类似的功能。

  • 现在我们来试一试从代码托管平台上拉取代码,并进行镜像构建和持续集成。 创建新项目并构建镜像 在控制台点击「代码构建」,然后在「代码构建」的界面中点击「创建新项目」。 第一步:填写项目名称 在「项目名称」上填写该项目的 Docker 镜像名称。 第二步:选择代码库 从第三方代码托管平台中选择我们想要构建的代码库,如果找不到需要的代码库可以点击右上角刷新按钮同步列表。 第三步:开启持续集成 持续集成是