从配置单元中以块形式获取相同配置单元查询的数据

裴楚青

2023-03-14

共有1个答案

卢嘉誉

2023-03-14

以下只是一种替代方法：

使您的配置单元表按扣排列，并使用列或cloumns，这些列或cloumns是唯一的，在一个范围内具有值，作为集群by字段。由于使用cluster by，您的数据将被全局排序并分布，因此您可以始终使用这些列作为筛选条件执行select查询。

以上只是一个建议，希望能有所帮助

类似资料：

配置单元查询在配置单元客户端和JDBC中的不同执行方式

下面的查询是我通过配置单元客户端、Java程序JDBC和Beeline执行的。在Hive cilent上执行时，只需21s就完成了，而Java程序JDBC和beeline分别需要110s和200s。配置单元客户端仅使用一个映射器就完成了此操作。 Java JDBC和beeline执行了5个MR作业。每个MR作业需要2个映射器和1个还原器。下面是每个表的行计数。 table_one有44981
配置单元错误：在配置单元查询中指定字符串

当我运行以下配置单元命令时 hive-e‘选择msg，将(*)从表中计数为cnt，其中像“%abcd%”这样的msg按msg排序按cnt desc；’sed的/[\t]/,/g'>table.csv 失败：ParseException第1：89行无法识别表达式规范中“like”“%”“password”附近的输入我知道在指定字符串“%abcd%”时有问题。该命令在配置单元环境中工作正常，但这里我
Json的配置单元查询错误

我正在使用twitter cloudera示例创建一个表，虽然我已经成功地创建了表并获得了数据，但我遇到了一个问题。我可以执行并返回数据，但当我进行更深入的操作（如）时，我会收到一个错误。以下是错误和堆栈跟踪： hive>从tweets中选择计数(*)；MapReduce作业总数=1启动作业1编译时确定的1个reduce任务中的1个：1为了更改还原器的平均负载（以字节为单位）：set hive
使用配置单元表的配置单元UDF

我在java中开发了一个工作正常的配置单元udf，我的函数返回输入与配置单元表中列之间的最佳匹配，因此它有以下简化的伪代码：我的问题是，如果这个函数是由Hive调用的，为什么我需要在代码中连接到Hive？我可以使用使用我的功能的用户所连接的当前连接吗？
HDFS数据上的配置单元查询异常

我在执行配置单元查询时遇到异常。我关注以下链接：http://www.thecloudavenue.com/2013/03/analysis-tweets-using-flume-hadoop-and.html 终端数据在这里：
配置单元查询性能优化

为了提高配置单元查询的性能，有哪些优化参数配置单元版本：-Hive 0.13.1-cdh5.2.1 配置单元查询：- 设置hive.exec.parallel=true；您能建议任何其他设置，除了以上，以提高配置单元查询的性能，我正在使用的类型查询。

从配置单元中以块形式获取相同配置单元查询的数据

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档