当前位置: 首页 > 面试题库 >

如何在Linux中查看Hive Orc文件的内容

公冶才
2023-03-14
问题内容

有没有办法查看配置单元大于等于0.11的orc文件的内容。我通常将cat gz文件解压缩,以查看其内容,例如:cat part-0000.gz | Pigz
-d | 更多说明:pigz是并行的gz程序

我想知道orc文件是否与此类似。


问题答案:

2020年更新的答案

根据@Owen的回答,ORC已经成长并成熟为自己的Apache项目。一个完整的ORC采纳者列表显示了现在它在多种大数据技术中的支持程度。

归功于@Owen和ORC
Apache项目团队,ORC的项目站点拥有完整维护的最新文档,有关在Linux本地文件系统上存储的ORC文件上使用Java或C ++独立工具。后者为原始的Hive
+ ORC Apache Wiki
页面带来了火炬。

原始答案的日期: May 30 '14 at 16:27

ORC文件转储实用程序随附于配置单元(0.11或更高版本):

hive --orcfiledump <hdfs-location-of-orc-file>

源链接



 类似资料:
  • less 命令的作用和 more 十分类似,都用来浏览文本文件中的内容,不同之处在于,使用 more 命令浏览文件内容时,只能不断向后翻看,而使用 less 命令浏览,既可以向后翻看,也可以向前翻看。 不仅如此,为了方面用户浏览文本内容,less 命令还提供了以下几个功能: 使用光标键可以在文本文件中前后(左后)滚屏; 用行号或百分比作为书签浏览文件; 提供更加友好的检索、高亮显示等操作; 兼容常

  • 我想知道如何在android中从我的移动存储或sdcard查看. pptx powerpoint演示文件,我使用了Apache-poi,但它在android上不起作用。

  • 本文向大家介绍Linux中查看指定文件夹内各个子文件夹内的文件数量,包括了Linux中查看指定文件夹内各个子文件夹内的文件数量的使用技巧和注意事项,需要的朋友参考一下 count脚本 执行 $ bash count.sh benchmark benchmark: 2317 benchmark/0: 20 benchmark/1: 891 benchmark/2: 65 benchmark/3: 1

  • 前面小节介绍了文件和目录相关的操作,本小节介绍如何使用 file、cat、more、tail 命令在不同场景下去查看文件相关信息和内容。 1. file 查看文件类型 file 命令可以用来查看文件类型,还能查看文件的编码格式,下面列举一些 file 命令的参数: file 命令参数名称 功能与作用描述 -b 表示 --brief,显示查看结果时,不显示文件名 -c 表示 --checking-p

  • 问题内容: 我找不到有关Apache Parquet文件的任何简单的英语解释。如: 这些是什么? 我需要Hadoop或HDFS来查看/创建/存储它们吗? 如何创建镶木地板文件? 如何查看镶木地板文件? 关于这些问题的任何帮助,我们将不胜感激。 问题答案: Apache Parquet是二进制文件格式,以列形式存储数据。Parquet文件中的数据类似于RDBMS样式表,其中具有列和行。但是,通常不是

  • 问题内容: 我已经读过Mysql服务器创建了一个日志文件,其中记录了所有活动-例如何时以及执行什么查询。 有人可以告诉我它在系统中的什么位置吗?我该怎么读? 基本上,我需要使用不同的输入[两个日期之间的备份]来备份数据库,所以我认为我需要在此处使用日志文件,这就是为什么要这样做… 我认为必须以某种方式保护此日志,因为可能会记录诸如用户名和密码之类的敏感信息[如果有任何查询要求];这样可以确保它安全