当前位置：首页 > 专题 >

《hive》专题

将SPARK DATAFRAME插入HIVE Managed Acid表不工作，HDP 3.0
我在将Spark dataframe插入配置单元表时遇到了一个问题。有人能帮帮我吗。HDP版本3.1，Spark版本2.3提前感谢。 //原始代码部分与在Spark中将out_temp保存为tempview不同，有什么方法可以直接在hive中创建表吗？有没有办法从spark dataframe插入到配置单元表中？谢谢大家抽出时间！
如何使用列的值范围对 Hive 表进行分区
我有一个蜂巢表2columns.EmployeeID和工资。数据如下所示。我想根据薪金列创建分区。例如划分为10000到20000，20001到30000的工资范围。我如何实现这一点。
Hive与Spark在执行上的差异
大家：我在找一个有更多知识的人来检查我对蜂巢和火花的理解我一直在研究不同的大型数据库解决方案，并试图理解Hive和Spark在执行方面的差异。我尝试安装Hadoop、Hive和Spark，看看它们的性能如何。我能够让Hadoop和Spark工作。我无法让Hive去工作。
如何获得使用Spark 1.5.2中的HiveContext创建的PySpark DataFrame？
更新：似乎我的错误可能是因为我如何安装Spark和/或Hive。在Databricks（托管）笔记本中使用窗口函数似乎非常简单。我得想办法在本地设置这个。我有一个Spark DataFrame，我需要在上面使用一个窗口函数。*我试着按照这里的说明操作，但我遇到了一些问题。设置我的环境：在这里，我不知道我在做什么，一切都开始出错：这就给了我这个错误： PY4JJavaError：调用O59.
spark create或replace temp view会为Hive Metastore添加内存吗？
我正在分析spark应用程序的内存使用情况。我们使用蜂箱和Pypark 在我们的应用程序中，我们有许多类似以下的SparkSQL查询，当运行查询时，我们的hiveta存储服务器承受很大的压力并运行内存溢出。虽然我找不到任何额外的语句，但缓存的磁盘存储将爆炸。只需选择数据，选择结果中有一些列，然后插入结果。（Claim_temp约为300 GB，将增长到1000 GB）创建临时视图语句是否将数据
Spark SQL是否使用Hive元存储？
我正在开发Spark SQL应用程序，我有几个问题：我读到Spark SQL在封面下使用Hive metastore？这是真的吗？我说的是一个纯Spark SQL应用程序，它不显式连接到任何配置单元安装我正在启动一个Spark SQL应用程序，不需要使用Hive。有什么理由使用蜂箱吗？据我所知，Spark SQL比Hive快得多；所以，我看不出有任何理由使用蜂箱。但我说得对吗
无法将Dataframe结果写入Hive表/LFS文件
我在将过滤后的数据写入文件时遇到了一个问题。在本地文件系统中创建了大约27个文件，但没有输出。下面是使用的代码：我把文件当做数据帧来读 val in_df=火花。阅读csv（“file:///home/Desktop/Project/inputdata.csv“”）。选择EXPR（“_c0作为Id”，“_c1作为名称”，“_c2作为部门”）然后将此数据帧注册为临时表 in_df.regist
火花数据帧保存AsTable不截断数据从Hive表
我正在使用Spark 2.1.0和Java SparkSession来运行我的SparkSQL。我正在尝试保存一个
Impala 2.7无法读取由Hive和Tez创建的拼花地板表中的任何数据
我正在使用一个使用大量union all运算符的查询填充拼花地板存储格式的分区配置单元表。查询是使用Tez执行的，默认设置会导致多个并发Tez编写器创建HDFS结构，其中拼花文件位于分区文件夹下的子文件夹中（文件夹名为Tez编写器ID）。例如/应用程序/蜂巢/仓库/划痕。db/test_table/part=p1/8/000000_0 即使在使元数据无效并收集表上的统计数据之后，Impala在查询
Amazon EMR：如何在参数中使用内联shell脚本添加Amazon EMR MapReduce/Hive/Spark步骤？
例如，我有两个配置单元作业，其中一个作业的输出在第二个作业中用作参数/变量。我可以在终端上成功运行以下comand以在EMR集群的主节点上获得结果。详细信息：失败：ParseException第7行：61无法识别表达式规范中“$”（“hive”）附近的输入 JAR位置：command-runner.JAR 主类：无失败时的操作：取消并等待我还用command-runner.jar尝试了它，以
运行日期为colume名称的Hive命令时出错
失败：ParseException行1:32 create table语句中“DATE”附近的“DATE”处缺少标识符行1:37输入“TIMESTAMP”不匹配（应为）create table语句中的“DATE”附近注：我是新来蜂巢的，请帮我弄明白。
如何使用HIVE JDBC驱动程序在列名中使用特殊字符？
我有一个java程序正在使用HortonWorks的JDBC驱动程序连接到VirtualBox中的数据库。一切都运行得很好，但我在sql查询中的冒号有问题。我正在尝试设置的rowid是“：rowid：”。我在前面和后面添加冒号，使列名对于其他应用程序是唯一的。现在冒号必须在那里，我想知道是否有一种方法使用官方站点的Hortonworks JDBC Driver for Apache Hive(v
连接到mysql rds时启动hive 3.1转移错误
尝试启动Hive转移3.1版本，连接到一个新的MySQL RDS并得到这个错误。当使用Hive2.3.2时，它工作得很好（在一个单独的MySQL RDS实例上）。有人知道是什么引起的吗？在启动HiveMetastore进程之前,已经初始化了mysql： > echo“如果不存在转移瘤，则创建数据库；”>hive_metaxore.sql echo“使用metaxore；”>>hive_metaxo
无法从$HIVE_HOME以外的任何其他位置启动配置单元
但当我从另一个位置（如root或其他位置）运行时,它会抛出一个错误：线程“main”java.lang.RuntimeException中出现异常：无法在org.apache.hadoop.hive.ql.util.ResourceDownLoader.ensureDirectory（resourceDownLoader.java:123)（org.apache.hadoop.hive.ql.u
无法启动配置单元，Hive-Metasore-Server出错
我的蜂巢设置有问题。不是我设置的，所以我对这个系统的了解有限...使用cloudera manager完成了自动更新，没有对postgresql数据库进行备份。转移数据库正在使用postgresql设置。就我的理解，不可能有一个既定的连接，但我不明白为什么，因此如何修复它。我将非常感谢一些关于如何在cloudera manager管理中修复此问题的提示。或如何重建转移或从postgresql切换

首页

10

11

12

13

14

15

16

17

18

尾页

最新发布

百度数据开发实习面经雷克沙测开二面上海百考丝信息科技有限公司--java面经海致科技--java面经京东Java一二面面经

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

python - 明明有这个文件为什么还报错？前端 - 使用 wxt 框架开发浏览器扩展遇到的问题?前端 - 你们用react-markdown做聊天的时候，内容是流不断返回的，如果有图片的话。会造成页面闪烁，因为contten不断变化，重新渲染了。怎么解决的？vue2 - vue虚拟滚动列表vue-virtual-scroller滚动卡顿的问题？前端 - uni-app打包web站点，webview在app端如何上传非媒体类型文件？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

minimal-light Eclipse Corrosion Shiretoko NovelHarvester Conceal KAProgressLabel nba-go chan

文档资料

gRPC 官方文档中文版 Apple Watch 人机交互指南 Ruby 用户指南 Go Web 编程 Ruby 源码解读