当前位置: 首页 > 知识库问答 >
问题:

如何创建包含多个hdfs文件的配置单元表

督德明
2023-03-14

所以基本上我想创建一个包含csv文件的表

共有1个答案

马凡
2023-03-14

配置单元的create table语句的location参数将*hdfs_path*(参见此处)作为参数。这样的路径不能是文件路径,而必须是目录路径,因此会出现错误。

在您的情况下,您可以将所需的文件放在一个特定的目录下,并在create table语句的LOCATION子句中指定这个目录。

 类似资料:
  • 问题内容: 我每天都在“测试”文件夹下写入文件。例如: 我在创建的LOGS表中看不到任何数据。 但是,我使用创建表 我可以看到那几天的记录。 我想在我的HIVE表中的/ test目录下查看所有数据,而且/ test目录每天都填充有新文件。 问题答案: 选项1 为了支持子目录 如果您的Hive版本低于2.0.0,那么 选项2 创建一个分区表 如果使用标准约定保留目录,例如,而不是保留目录,将更易于管

  • 我努力实现的目标 < li >从源大JSON文件(employee-sample.json)获取数据 < li >一个简单的spark应用程序,将它作为文本文件读取并存储在parquet(simple-loader.java)中。我不知道JSON文件中有什么,所以我不能放入任何模式,所以我希望读取模式,而不是写入模式。创建了一个parquet文件,其中一列名为“value ”,包含JSON字符串

  • 主要内容:单个Struts配置文件,多个Struts配置文件Struts 2自带有“包含文件”功能,包含多个Struts配置文件合并为一个单元。 单个Struts配置文件 让我们来看看一个糟糕的 Struts 2 配置示例。 struts.xml 在上面的Struts配置文件中,组织所有“用户”和“审核”配置设置在一个文件中,这不是建议的,必须回避。应该打破这种形式,而将struts.xml文件分成更小的模块相关的部分。 多个Struts配置文件 在Str

  • 当然,希望有人能帮助我创建外部配置单元分区表,方法是根据HDFS目录中的逗号分隔文件自动添加数据。我的理解(或缺乏理解)是,当您定义一个已分区的CREATE外部表并为其提供一个位置时,它应该递归地扫描/读取每个子目录,并将数据加载到新创建的已分区的外部表中。下面的内容应该会对我的烦恼提供一些更多的了解… 每个'dt='子目录都包含分隔的文件。

  • 问题内容: 我想创建并填充一个配置单元表,而无需从磁盘加载任何内容。 具体来说,我有 我想创建一个有9行的表: 同样,我 不 想要写一个文件,并将其加载到蜂巢。 用例: 迭代 为SO问题创建小型测试样本 问题答案: