当前位置: 首页 > 知识库问答 >
问题:

基于部分行键过滤HBase中的行

姬温文
2023-03-14

行列+单元格
001_1454578003995 column=hd:abc,时间戳=1454578173766,值=2

001_1454578003996 column=hd:def,timestamp=1454578173766,value=2

002_1454578003997 Column=HD:IJK,时间戳=1454578173766,值=2

你能帮我做这个吗?

共有1个答案

慕璞
2023-03-14

对于这种情况,我们需要使用过滤器[1]执行扫描

因为我们必须根据rowkey进行筛选,所以我们可以将rowfilterregexstringcomparator一起使用。RegexStringComparator允许我们使用方便的正则表达式进行查询/限制,但请记住,对于大量数据,性能可能会受到影响。一些用于说明的伪代码

   ...
    Filter filter = new RowFilter(CompareFilter.CompareOp.EQUAL,
    new RegexStringComparator("\\d+_12345*"));
    scan.setFilter(filter);
    ...

我们还可以组合多个筛选器。(请参见FilterList)

[1]Hbase扫描api:https://Hbase.apache.org/apidocs/org/apache/hadoop/Hbase/client/scan.html

[2]过滤器和比较器:https://hbase.apache.org/apidocs/org/apache/hadoop/hbase/filter/package-summary.html

[3]https://hbase.apache.org/apidoccs/org/apache/hadoop/hbase/filter/fuzzyrowfilter.html

 类似资料:
  • 我的Hbase表有一列,其中包含键值对数组。

  • 在这种情况下,我需要根据项的某些属性(即条件是内部的而不是外部的)筛选。我发现javafx有,所以我尝试了一下。我可以设置谓词和筛选工作,直到确定筛选的属性值发生变化。现在可以像下面这样设置谓词: 由于谓词返回boolean而不是BooleanProperty,因此对该属性的更改不会反映在列表中。 对此有什么简单的解决办法吗?我可以尝试做一些变通方法,例如创建一个单独的列表并同步它,或者每次属性在

  • 一、HBase过滤器简介 Hbase 提供了种类丰富的过滤器(filter)来提高数据处理的效率,用户可以通过内置或自定义的过滤器来对数据进行过滤,所有的过滤器都在服务端生效,即谓词下推(predicate push down)。这样可以保证过滤掉的数据不会被传送到客户端,从而减轻网络传输和客户端处理的压力。 二、过滤器基础 2.1 Filter接口和FilterBase抽象类 Filter 接口

  • 本文向大家介绍基于springboot集成hbase过程解析,包括了基于springboot集成hbase过程解析的使用技巧和注意事项,需要的朋友参考一下 这篇文章主要介绍了基于springboot集成hbase过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 springboot-habse: https://github.com/spr

  • 使用fuglede的答案,很容易找到数据帧列的局部极值: 它给出了以下图表: 我现在想把这些极值成对分组(最小值) 有没有一种优雅而快速的方法可以做到这一点?