当前位置: 首页 > 知识库问答 >
问题:

如何用文件中提到的列名称加载一个文件到配置单元?

许兴文
2023-03-14

我有一个文本文件,我已经加载到我新创建的配置单元表。当我得到文件时,它也有列名。因此,我从文件中删除了列名,只加载了数据。但是,我在前两行得到了“null”,然后数据开始显示。表有39列,我很确定null值是针对列名的。

NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULLNULL     NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL
600002158100    2000-02-15      2018-09-24 07:06:26     63      1       0       0       0       0       0       1       0       0       0       0       0   00       0       0       0       0               "S"     0       NULL    "Y"     "N"     "N"     0       7       "xyz"  "MEDIUM"        "abc" "pqr"  "Sam"   1       "chris"        1999-07-31

1)So, do I had to load the files including the column names with it? 
2) I still believe that the file that needs to be loaded need not have column names in it, just the data. please correct me if I am wrong.

使用tblproperties后的新输出

abc      xyz        NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    pqr       name  NULL     NULL    age    NULL    NULL    city    country       date     year     month

即。当我激发“Select*from tbl LIMI4”时,我会得到头名和数据。请指教

共有1个答案

丁韬
2023-03-14

您可以在创建able(或以后的alter)时设置tablproperties以跳过标头。

tblproperties ("skip.header.line.count"="1")

这里count显示了表示标题的第一行数。

 类似资料:
  • 我使用FOP-2.1从xml和xsl-fo生成PDF文件,并花了很多时间来配置fop配置文件(我使用西里尔字体),根据https://xmlgraphics.apache.org/fop/2.1/configuration.html 在命令行中测试了它,它工作正常: fop-c conf.xml-xml xml.xsl xsl-pdfpdf 接下来,我需要在javaweb应用程序中执行同样的操作。

  • 问题内容: 在一个文本文件中,我有150个字。我还有另一个文本文件,大约有100,000行。 如何检查属于第一个文件的每个单词是否在第二个文件中? 我曾考虑过使用,但找不到如何使用它来阅读原始文本中的每个单词。 有没有办法做到这一点?还是其他解决方案? 我尝试使用此shell脚本,但它几乎匹配每一行: 我发现的另一种方法是: 问题答案: 您可以使用: 否则匹配完整的单词: 更新: 根据评论:

  • 下面是我在powershell中的脚本 我有几个*.zip文件,我想解压缩到一个特定的文件夹中。问题是,7zip创建名为*.zip的子文件夹,并将文件提取到该文件夹中。 例如,我有a.zip,b.zip和c.zip文件,我想把它们解压缩到构建文件夹中。现在,在我的命令之后,它们被解压缩到: 构建/c/(这里是c.zip文件) 我希望它们都在builds/(这里是a、b、c文件)中,并带有完整的目录

  • 我是hadoop蜂巢的新手。我使用的是开源的hadoop 2.7.1配置单元1.2.2。它安装在ubuntu上,一个单一的节点集群。我在csv文件中有106行30列数据。我使用以下代码将其导入到配置单元表中: 然后我得到了null列名:返回的前半部分,返回的后半部分 请帮我怎么解决。提前感谢!

  • 问题内容: 我的文件夹上有多个csv文件。列标题不同,但列数据相同。 括号内的数字是实际的列名。项目(67)67是列名 因此,忽略字符串Item,仅考虑int()中的int并执行操作。 样本文件:https : //drive.google.com/open?id=1q7c1AqCRKRufSVh– 9o0W6rdz28QyBGa 说明: 驱动器上的文件应附加在一起。基于列名称的“启用条件”。如果

  • 给定一个文件夹,其中包含多个具有不同列长度的csv文件 必须使用python将它们合并到单个csv文件中,并将文件名打印为一列。 输入:https://www.dropbox.com/sh/1mbgjtrr6t069w1/AADC3ZrRZf33QBil63m1mxz_a?dl=0 输出: