问题：

来自HDFS Twitter数据的Hive查询

郭盛

2023-03-14

我一直在关注这篇关于如何用Hive分析twitter数据的文章:http://blog . cloud era . com/blog/2012/11/analyzing-Twitter-data-with-Hadoop-part-3-query-semi-structured-data-with-Hive/

我设置了水槽来收集twitter数据并写入HDFS。我已经设置了一个指向同一HDFS位置的配置单元表。

当我从hive运行这样的命令时：SELECT entities.user_mentions[0]。screen_name来自推文；

我得到如下响应:OK耗时:0.16秒。

不管我运行什么查询，我都不会得到任何结果。

由于我是Hive新手，我希望在Hive命令行中看到结果，还是必须从mySQL中挖掘结果。mySQL是元存储数据库。

共有1个答案

周培

2023-03-14

当hive数据使用目录进行分区时，需要对其进行检索以查看分区/分区。因此，运行msck修复表your_table_name应该可以解决您的问题。

类似资料：

Hive 数据查询详解

一、数据准备为了演示查询操作，这里需要预先创建三张表，并加载测试数据。数据文件 emp.txt 和 dept.txt 可以从本仓库的resources 目录下载。 1.1 员工表 -- 建表语句 CREATE TABLE emp( empno INT, -- 员工表编号 ename STRING, -- 员工姓名 job STRING, --
来自WordPress中外部数据库的SQL查询

问题内容：其实我的主机上有一个php网站。现在，我将个性化一个Wordpress主题以替换它。暂时还可以，但是旧网站具有内置功能，可以使用令牌连接到另一个数据库。此连接仅用于获取一些数据。您能告诉我如何在新的wordpress主题中实现此功能吗？是否存在一个wordpress插件？谢谢问题答案：将wordpress连接到第二个数据库（没有令牌）的最简单方法是添加以下代码（用连接数据
Google Sheets查询来自多个列的相同数据

我们在Google表单响应电子表格中有员工训练数据，范围从A1到JQ1000。当Goggle表单完成时，这个电子表格会自动填充，但是很难查看，所以我想整理一下。表单响应电子表格填充了培训活动、活动日期和参加该活动的员工。为了整理它，我认为最好使用转置（Transpose）（查询），但员工的姓名可能会在不同的列和行中出现多次。我不想写等等到JQ列。有人能帮我一个更简单的公式吗？
来自Rails的Ajax数据

嗨，我刚刚按照Ryan Bates的指南从服务器加载数据，因为客户端与可数据交互。 http://railscasts.com/episodes/340-datatables?view=asciicast 在他的产品数据类中，他定义了一个排序函数：基本上，列名用于查询数据库，因此“名称”、“类别”等都是产品模型的属性。因此，将生成一个SQL SELECT语句，其名称或类别用于对ASC或DESC进
在React中使用GraphQL查询来自上一个查询的数据

但是，当我想使用从上一次查询中获得的Id进行第二次查询并使用该Id作为筛选器时，该怎么办？当我像以前一样在ExampleComponent中返回另一个graphql查询时，我会得到一个错误，即我没有返回有效的react组件。那我该怎么做呢？提前感谢！
来自现有数据的数组

此函数类似于numpy.array，除了它有较少的参数。这个例程对于将 Python 序列转换为ndarray非常有用。构造器接受下列参数：下面的例子展示了如何使用asarray函数： # 将列表转换为 ndarray import numpy as np a = np.asarray(x) print a 输出如下： [1 2 3] 示例 2 import numpy as np x

来自HDFS Twitter数据的Hive查询

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档