当前位置：首页 > 专题 >

《hive》专题

Spark Hive上下文-带分区的Avro表
对于分区的Avro配置单元表，在Avro模式中具有大写字符的字段名将被拉回为空。我想知道我是否缺少一些设置/解决方法，或者这只是一个配置单元上下文的错误。我已经尝试过将以下内容添加到DDL中： …并设置spark.sql。区分大小写，对真/假敏感 Spark版本1.5.0 Hive版本1.1.0 您可以通过在 Hive 中运行以下 DDL 来重新创建问题： ...
如何使用 HIVE 更改或修改其他格式的日期列值
我有一个包含日期列的表。早些时候，我以“7 / 8 / 2012”格式插入了日期值。- m/d/yyyy 我想以“07/08/2014”的形式更改此格式。- 月/日/年我的表中有大约3000个条目。如何将此日期值更改为新格式。我试图使用“alter”命令和set，但无法批量更改它。
如何从存储为parquet的Hive中的分区表中删除字段？
我正在寻找一种方法来修改配置单元中的拼花数据表，以删除一些字段。该表是受管理的，但这并不重要，因为我可以将其转换为外部问题是我不能使用命令＜code＞ALTER TABLE…用分区拼花表替换列。它适用于文本文件格式(分区或非分区)，仅适用于非分区拼花桌子。我尝试替换列，但结果如下：我考虑过一些解决方案，但没有一个适合我的情况：首先 -[可选]在外部转换表 -删除该表 -使用所需字段重新创
创建Hive表以从拼花/avro模式读取拼花文件
我们正在寻找一种解决方案，以便创建一个外部配置单元表，根据parquet/avro模式从parquet文件中读取数据。换句话说，如何从拼花/avro模式生成hive表？谢谢:)
如何使用在 Hive 中使用 Apache Drill 创建的 Parquet 文件
Apache Drill有一个很好的功能，可以从许多传入的数据集中制作镶木地板文件，但是似乎没有太多关于如何稍后使用这些镶木地板文件的信息 - 特别是在Hive中。 Hive有没有办法利用这些“1_0_0.parquet”等文件？也许创建一个表并从拼花文件加载数据，或者创建一个表并以某种方式将这些拼花文件放在hdfs中，以便Hive读取它？
Hive 元存储与 alluxio 存储在镶木地板数据类型问题
我使用prestodb和hive metastore作为模式存储，使用alluxio缓存作为数据的外部存储。alluxio和hive模式中使用的存储格式是PARQUET。同时使用配置单元目录从presto检索时间戳字段。我会跟踪错误。列 utdate 声明为类型时间戳，但 Parquet 文件将列声明为 INT64 类型数据集的架构为创建表测试（ utcdate timestamp ） WI
将具有NULL值的额外列从一个表插入到另一个表HIVE
表1有col1、col2、col3、col4、col5列表2有col1、col3、col5列我想将表2中的行插入表1 但是col2，col4在插入表2后应该是NULL数据类型我怎么能在蜂巢，目前我正在使用Hortonworks 3.1版本
PySpark HiveContext错误
我尝试使用下面的命令使用PySpark刷新表分区。我可以发出任何其他SQL命令，但会给我带来问题新错误：
SPARK-1.5.1在java代码中使用HiveContext为hive 1.2.0抛出内存不足错误
HiveContext正得到正确的初始化，因为它能够建立与hive转移瘤的连接。在处出现异常 spark试图提交作业时出现的错误如下：提交15/12/10 20:00:42 INFO DagScheduler：从ResultStage 0（在HiveJDBCTest.java:30处的collectAsList处的MapPartitionSrdd[3]）提交2个缺少的任务15/12/10 20:
Hive如何存储数据（从HDFS加载）？
我对Hadoop（HDFS和Hbase）和Hadoop生态系统(Hive、Pig、Impala等）相当陌生。我已经很好地理解了Hadoop组件，如NamedNode、DataNode、Job Tracker、Task Tracker，以及它们如何协同工作以高效的方式存储数据。 null
使用带有kerberos的hive metastore服务器进行oozie hive操作
什么时候使用Hadoop、HBase、Hive和Pig？
AWS弹性MapReduce下Hive查询的慢速性能
我遇到了一个奇怪的问题，我向你保证我已经谷歌了很多次。谢谢
HiveServer：ClassNotFinder（HiveServer）
首先：我对蜂巢还不熟悉。我刚刚安装了Hive，当我运行“hive”时，服务器会启动并将我带入CLI。但是当我尝试使用“hive--service hiveserver”将其作为服务/服务器启动时，我会得到：正在线程“main”java中启动配置单元Thrift服务器异常。lang.ClassNotFoundException：组织。阿帕奇。hadoop。蜂箱服务java上的HiveServer
如何在Hive 3.1上创建DynamoDB外部表
我想知道是否有可能使用Hive在AWS上有一个指向DynamoDB表的外部表。我没有使用AWS EMR，我使用的是通过Apache Ambari配置的Hadoop Stack。配置单元版本：配置单元3.1.0.3.1.4.0-315 我所做的是：直接从maven存储库下载了EMR Dynamo-Hive连接器JARS：https://mvnrepository.com/artifact/com.

首页

4

5

6

7

8

9

10

11

12

尾页

最新发布

百度数据开发实习面经雷克沙测开二面上海百考丝信息科技有限公司--java面经海致科技--java面经京东Java一二面面经

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

python - 明明有这个文件为什么还报错？前端 - 使用 wxt 框架开发浏览器扩展遇到的问题?前端 - 你们用react-markdown做聊天的时候，内容是流不断返回的，如果有图片的话。会造成页面闪烁，因为contten不断变化，重新渲染了。怎么解决的？vue2 - vue虚拟滚动列表vue-virtual-scroller滚动卡顿的问题？前端 - uni-app打包web站点，webview在app端如何上传非媒体类型文件？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

minimal-light Eclipse Corrosion Shiretoko NovelHarvester Conceal KAProgressLabel nba-go chan

文档资料

gRPC 官方文档中文版 Apple Watch 人机交互指南 Ruby 用户指南 Go Web 编程 Ruby 源码解读