当前位置: 首页 > 知识库问答 >
问题:

将csv文件inport到配置单元表中,列名为null

凌朗
2023-03-14

我是hadoop蜂巢的新手。我使用的是开源的hadoop 2.7.1配置单元1.2.2。它安装在ubuntu上,一个单一的节点集群。我在csv文件中有106行30列数据。我使用以下代码将其导入到配置单元表中:创建表clinicaldatabc(comp_tcga_id字符串、gender字符串、age_inti_diag int,ER_status字符串、PR_status字符串、HER2_final_status字符串、HER2_final_status字符串、HER2_final_status字符串、肿瘤字符串、Tumor_T1_code字符串、Node字符串、Node_coded字符串、转移字符串、METAXIS_Coded字符串、AJCC_Stage字符串、COVERTED_STAGE字符串、AJCC_Stage字符串、COVERTED_STAGE字符串miRNA_clusters int、methylation_clusters int、RPPA_clusters int、CN_clusters int、integrated_clusters_with_PAM50 int、integrated_clusters_no_exp int、integrated_clusters_unsup_exp int)行格式以“,”结尾的分隔字段;

然后我得到了null列名:返回的前半部分,返回的后半部分

请帮我怎么解决。提前感谢!

共有1个答案

洪捷
2023-03-14

配置单元查询结果中空列名可能重复

这里要注意的第一件事是,空值出现在不属于string类型的列中

 类似资料:
  • 我有一个csv文件,名为测试。hdfs中的csv。文件是通过filezilla放在那里的。当我通过putty登录到Edge节点时,我能够查看文件的路径和内容,使用的帐户凭据与我将文件放入hdfs时使用的帐户凭据相同。然后,我连接到配置单元并尝试创建一个外部表,使用以下语句指定我的csv文件在hdfs中的位置: 当我执行这个命令时,它正在配置单元上创建一个外部表,但正在创建的表是空的,只显示我在cr

  • 工作在配置单元表,我需要改变列名如下,它的工作与预期和改变列名,但下划线值该列得到NULL。 这里更改的列名是hdfs_load_date,重命名列名后值为NULL。 有人有办法解决这个问题吗。提前感谢!!

  • 我正在尝试在Hive中创建一个表。需要帮助。 示例代码:创建外部表table1(id字符串、名称字符串、“12489738”字符串、“12492628”字符串、“12492633”字符串、“12492638”字符串、“12492655”字符串、“12492659”字符串)行格式分隔字段,由“\t”LOCATION“”tblproperties(“skip.header.line.count”=“1

  • 我有一个文本文件,我已经加载到我新创建的配置单元表。当我得到文件时,它也有列名。因此,我从文件中删除了列名,只加载了数据。但是,我在前两行得到了“null”,然后数据开始显示。表有39列,我很确定null值是针对列名的。 使用tblproperties后的新输出 即。当我激发“Select*from tbl LIMI4”时,我会得到头名和数据。请指教

  • 问题内容: 我的文件夹上有多个csv文件。列标题不同,但列数据相同。 括号内的数字是实际的列名。项目(67)67是列名 因此,忽略字符串Item,仅考虑int()中的int并执行操作。 样本文件:https : //drive.google.com/open?id=1q7c1AqCRKRufSVh– 9o0W6rdz28QyBGa 说明: 驱动器上的文件应附加在一起。基于列名称的“启用条件”。如果

  • 此时,我已使用以下命令成功连接到数据库。查询在控制台上输出正确的结果。 另外,不是很清楚文件的最终位置。应该是hdfs中的文件路径正确吗?