问题：

HBase中基于时间戳的扫描？

庄萧迟

2023-03-14

例如，对于hbase表“test_table”，插入的值为：

Row1 - Val1 => t
Row1 - Val2 => t + 3
Row1 - Val3 => t + 5

Row2 - Val1 => t
Row2 - Val2 => t + 3
Row2 - Val3 => t + 5

在扫描“test_table”时，其中version=t+4应返回

Row1 - Val1 => t + 3
Row2 - Val2 => t + 3

如何在HBase中实现基于时间戳的扫描（基于小于或等于时间戳的最新可用值）？

共有1个答案

施阳夏

2023-03-14

考虑下表：

hbase(main):009:0> create 't1', { NAME => 'f1', VERSIONS => 100 }
hbase(main):010:0> put 't1', 'key1', 'f1:a', 'value1'
hbase(main):011:0> put 't1', 'key1', 'f1:a', 'value2'
hbase(main):012:0> put 't1', 'key1', 'f1:a', 'value3'
hbase(main):013:0> put 't1', 'key2', 'f1:a', 'value4'
hbase(main):014:0> put 't1', 'key2', 'f1:a', 'value5'
hbase(main):015:0> put 't1', 'key1', 'f1:a', 'value6'

以下是其所有版本的shell扫描：

hbase(main):003:0> scan 't1', {VERSIONS => 100 }
ROW              COLUMN+CELL
 key1            column=f1:a, timestamp=1416083314098, value=value6
 key1            column=f1:a, timestamp=1416083294981, value=value3
 key1            column=f1:a, timestamp=1416083293273, value=value2
 key1            column=f1:a, timestamp=1416083291009, value=value1
 key2            column=f1:a, timestamp=1416083305050, value=value5
 key2            column=f1:a, timestamp=1416083299840, value=value4

以下是根据您的请求,扫描仅限于特定的时间戳：

hbase(main):002:0> scan 't1', { TIMERANGE => [0, 1416083300000] }
ROW              COLUMN+CELL
 key1            column=f1:a, timestamp=1416083294981, value=value3
 key2            column=f1:a, timestamp=1416083299840, value=value4

这里的Java代码是一样的：

package org.example.test;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.client.*;
import org.apache.hadoop.hbase.util.Bytes;
import java.io.IOException;

public class test {
    public static void main (String[] args) throws IOException {
        HTable table = new HTable(HBaseConfiguration.create(), "t1");
        Scan s = new Scan();
        s.setMaxVersions(1);
        s.setTimeRange (0L, 1416083300000L);
        ResultScanner scanner = table.getScanner(s);
        for (Result rr = scanner.next(); rr != null; rr = scanner.next()) {
            System.out.println(Bytes.toString(rr.getRow()) + " => " +
                    Bytes.toString(rr.getValue(Bytes.toBytes("f1"), Bytes.toBytes("a"))));
        }
    }
}

请注意，指定时间范围的最大值是排除在外的，这意味着如果您想获得所有具有最大时间戳T的键的最后值，您应该将范围的上界指定为T+1

类似资料：

HBase设置时间戳

我有问题设置行时间戳使用Java API。当我试图将时间戳值添加到put构造函数（或put.add（））中时，什么也不会发生，从表中读取行后，我会得到系统提供的时间戳。在独立模式下运行的HBase 0.92.1。提前感谢您的帮助！
基于时间戳计算不同时间间隔的mfcc

我偶然发现了这个不错的教程https://github.com/manashmndl/DeadSimpleSpeechRecognizer其中数据是基于由文件夹分隔的样本进行训练的，所有mfcc都是一次计算的。我正试图以不同的方式实现类似的目标。基于此：https://librosa.github.io/librosa/generated/librosa.feature.mfcc.html l
基于时间戳的DynamoDB查询/排序

在DynamoDB中，我有一个表，其中每条记录都有两个日期属性，
基于时间戳合并数据帧

有两个这样的数据帧（示例） df1 df2 然后，我想加入df1和df2，但是我不知道如何做到这一点，因为在第二个df中我只有开始和结束时间。如何根据第二个df的数据将条件放在第一个df上？这就是我想要的
带时间戳的HBase Put不起作用

我编写了一个简单的测试程序来插入一行。与普通HBase Put示例程序的唯一不同之处在于，Put实例及其KeyValue实例是用时间戳创建的。预期的行为是插入行。但是，在我的HBase环境中，没有插入行。下面是我的测试程序。该程序生成的控制台输出如下所示。而hbase shell中的“scan”表示“0行（s）”。
Hbase从单元格中提取值和时间戳

在hbase中，我有很多列：name,city,... 不是所有列都有值（例如，有些行只能有'name') 我想提取一行中的所有列+列的时间戳（按特定顺序），如果值为null，我想返回空字符串。我面临的问题是，我必须通过'family'和'qualifier'访问中的列（我不能通过的索引访问，因为空值被跳过）

HBase中基于时间戳的扫描？

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档