当前位置: 首页 > 面试题库 >

Hive表在所有查询上返回空结果集

柯锋
2023-03-14
问题内容

我创建了一个Hive表,该表从文本文件加载数据。但是它对所有查询返回的空结果集。

我尝试了以下命令:

CREATE TABLE table2(
id1 INT,
id2 INT,
id3 INT,
id4 STRING,
id5 INT,
id6 STRING,
id7 STRING,
id8 STRING,
id9 STRING,
id10 STRING,
id11 STRING,
id12 STRING,
id13 STRING,
id14 STRING,
id15 STRING
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '|'
STORED AS TEXTFILE
LOCATION '/user/biadmin/lineitem';

命令被执行,并且表被创建。但是,对于所有查询,始终返回0行,包括SELECT * FROM table2;

样本数据:

单行输入数据:

1 | 155190 | 7706 | 1 | 17 | 21168.23 | 0.04 | 0.02 | N | O | 1996-03-13 |
1996-02-12 | 1996-03-22 |送货到人|卡车|上方的普通法院|

我已经附上了数据文件的屏幕截图。命令的输出:DESCRIBE FORMATTED table2;

| Wed Apr 16 20:18:58 IST 2014 : Connection obtained for host: big-instght-15.persistent.co.in, port number 1528. |
| # col_name                    data_type                   comment                                               |
|                                                                                                                 |
| id1                         int                         None                                                    |
| id2                         int                         None                                                    |
| id3                         int                         None                                                    |
| id4                         string                      None                                                    |
| id5                         int                         None                                                    |
| id6                         string                      None                                                    |
| id7                         string                      None                                                    |
| id8                         string                      None                                                    |
| id9                         string                      None                                                    |
| id10                        string                      None                                                    |
| id11                        string                      None                                                    |
| id12                        string                      None                                                    |
| id13                        string                      None                                                    |
| id14                        string                      None                                                    |
| id15                        string                      None                                                    |
|                                                                                                                 |
| # Detailed Table Information                                                                                    |
| Database:                   default                                                                             |
| Owner:                      biadmin                                                                             |
| CreateTime:                 Mon Apr 14 20:17:31 IST 2014                                                        |
| LastAccessTime:             UNKNOWN                                                                             |
| Protect Mode:               None                                                                                |
| Retention:                  0                                                                                   |
| Location:                   hdfs://big-instght-11.persistent.co.in:9000/user/biadmin/lineitem                 |
| Table Type:                 MANAGED_TABLE                                                                       |
| Table Parameters:                                                                                               |
|         serialization.null.format                                                                               |
|         transient_lastDdlTime        1397486851                                                                 |
|                                                                                                                 |
| # Storage Information                                                                                           |
| SerDe Library:              org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe                                  |
| InputFormat:                org.apache.hadoop.mapred.TextInputFormat                                            |
| OutputFormat:               org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat                          |
| Compressed:                 No                                                                                  |
| Num Buckets:                -1                                                                                  |
| Bucket Columns:             []                                                                                  |
| Sort Columns:               []                                                                                  |
| Storage Desc Params:                                                                                            |
|         field.delim                 |                                                                          |

+ -------------------------------------------------
-------------------------------------------------- -------------- +

谢谢!


问题答案:

请确保位置 /user/biadmin/lineitem.txt 实际上存在,并且那里有数据。由于您正在使用 LOCATION
子句,因此您的数据必须存在于此处,而不是默认的仓库位置 / user / hive / warehouse

快速进行 ls 验证:

bin/hadoop fs -ls /user/biadmin/lineitem.txt

另外,请确保使用正确的 定界符



 类似资料:
  • 我试图从一个网站刮数据练习网络刮。但是返回空集。我如何解决这个问题? 输出:

  • Spark 1.3.1(也尝试了Spark 1.5.1) Hadoop 2.6(在CDH 5.4.0上) Pyspark--主纱--num--执行者5--执行者-内存10g--驱动程序-内存4g--驱动程序-核心4 database.table有超过2k个分区 database.table在field1上分区(在where子句中使用) 占用的时间不确定--我不得不停止查询的执行,因为它很快占用了我

  • 我有一个奇怪的怪癖,当我运行一个nativeQuery调用单个列中的所有不同值时,我没有得到任何结果。然而,当我从查询中删除“distinct”操作符时,它的工作非常好,告诉我这不是数据库连接或内容问题。 控制器方法: 显然,我可以编写一个“distinct”方法来遍历这个列表,但对我来说,查询不起作用似乎很奇怪 编辑:在备注中请求的存储库和实体类中添加 资源库接口: 创建和修改表的SQL

  • 我正在玩mongob,并将一些测试数据{name:"david"}输入到“用户”集合中。我通过键入mongoshell验证了数据在MongoDB中 结果: 在 node.js 脚本中,使用以下代码: 不返回任何结果 我没有发现任何错误,也没有错误。请告知

  • 问题内容: 我有一个数据库,正在运行以下查询: 上面的查询一次返回两个结果集,我不能分别触发两个查询。如何在Java类中一次处理两个结果集? 问题答案: 正确的代码来处理JDBC语句返回的多个: 重要位: 并返回以表明语句的结果只是一个数字,而不是一个。 您需要检查以了解是否还有更多结果。 确保关闭结果集或使用

  • 我有以下表格结构: 1-课程(course_id、course_nam、语言、course_price、create_date、average_rating、course_description、certifica_price、course_creator_id) 2-学生(学生证、钱包) 3-折扣(折扣id、折扣课程id、允许的许可课程id、开始日期、结束日期、百分比) 4-报名(student