当前位置: 首页 > 知识库问答 >
问题:

来自HDFS Twitter数据的Hive查询

郭盛
2023-03-14

我一直在关注这篇关于如何用Hive分析twitter数据的文章:http://blog . cloud era . com/blog/2012/11/analyzing-Twitter-data-with-Hadoop-part-3-query-semi-structured-data-with-Hive/

我设置了水槽来收集twitter数据并写入HDFS。我已经设置了一个指向同一HDFS位置的配置单元表。

当我从hive运行这样的命令时:SELECT entities.user_mentions[0]。screen_name来自推文;

我得到如下响应:OK耗时:0.16秒。

不管我运行什么查询,我都不会得到任何结果。

由于我是Hive新手,我希望在Hive命令行中看到结果,还是必须从mySQL中挖掘结果。mySQL是元存储数据库

共有1个答案

周培
2023-03-14

当hive数据使用目录进行分区时,需要对其进行检索以查看分区/分区。因此,运行msck修复表your_table_name应该可以解决您的问题。

 类似资料:
  • 一、数据准备 为了演示查询操作,这里需要预先创建三张表,并加载测试数据。 数据文件 emp.txt 和 dept.txt 可以从本仓库的resources 目录下载。 1.1 员工表 -- 建表语句 CREATE TABLE emp( empno INT, -- 员工表编号 ename STRING, -- 员工姓名 job STRING, --

  • 问题内容: 其实我的主机上有一个php网站。现在,我将个性化一个Wordpress主题以替换它。暂时还可以,但是旧网站具有内置功能,可以使用令牌连接到另一个数据库。此连接仅用于获取一些数据。 您能告诉我如何在新的wordpress主题中实现此功能吗? 是否存在一个wordpress插件? 谢谢 问题答案: 将wordpress连接到第二个数据库 (没有令牌) 的最简单方法是添加以下代码(用连接数据

  • 我们在Google表单响应电子表格中有员工训练数据,范围从A1到JQ1000。当Goggle表单完成时,这个电子表格会自动填充,但是很难查看,所以我想整理一下。 表单响应电子表格填充了培训活动、活动日期和参加该活动的员工。为了整理它,我认为最好使用转置(Transpose)(查询),但员工的姓名可能会在不同的列和行中出现多次。我不想写等等到JQ列。有人能帮我一个更简单的公式吗?

  • 嗨,我刚刚按照Ryan Bates的指南从服务器加载数据,因为客户端与可数据交互。 http://railscasts.com/episodes/340-datatables?view=asciicast 在他的产品数据类中,他定义了一个排序函数: 基本上,列名用于查询数据库,因此“名称”、“类别”等都是产品模型的属性。因此,将生成一个SQL SELECT语句,其名称或类别用于对ASC或DESC进

  • 但是,当我想使用从上一次查询中获得的Id进行第二次查询并使用该Id作为筛选器时,该怎么办?当我像以前一样在ExampleComponent中返回另一个graphql查询时,我会得到一个错误,即我没有返回有效的react组件。那我该怎么做呢? 提前感谢!

  • 此函数类似于numpy.array,除了它有较少的参数。 这个例程对于将 Python 序列转换为ndarray非常有用。 构造器接受下列参数: 下面的例子展示了如何使用asarray函数: # 将列表转换为 ndarray import numpy as np a = np.asarray(x) print a 输出如下: [1 2 3] 示例 2 import numpy as np x