问题：

在Cassandra中存储最后一次接触时间的最佳方法

翟奕

2023-03-14

我想要的桌子：

CREATE TABLE ksp1.user_last_job_activities (
    user_id bigint,
    touched_at timeuuid,
    PRIMARY KEY (user_id, touched_at)
) WITH CLUSTERING ORDER BY (touched_at DESC)
    AND bloom_filter_fp_chance = 0.01
    AND caching = '{"keys":"ALL", "rows_per_partition":"NONE"}'
    AND comment = ''
    AND compaction = {'min_threshold': '4', 'class': 'org.apache.cassandra.db.compaction.SizeTieredCompactionStrategy', 'max_threshold': '32'}
    AND compression = {'sstable_compression': 'org.apache.cassandra.io.compress.LZ4Compressor'}
    AND dclocal_read_repair_chance = 0.1
    AND default_time_to_live = 0
    AND gc_grace_seconds = 864000
    AND max_index_interval = 2048
    AND memtable_flush_period_in_ms = 0
    AND min_index_interval = 128
    AND read_repair_chance = 0.0
    AND speculative_retry = '99.0PERCENTILE';

更新

谢了！我做了一些关于writetime的实验，因为我无论如何都要写值，所以我只写时间。

CREATE TABLE simple_user_last_activity (
    user_id bigint,
    touched_at timestamp,
    PRIMARY KEY (user_id)
);

INSERT INTO simple_user_last_activity (user_id, touched_at) VALUES (6, dateof(now()));
SELECT touched_at from simple_user_last_activity WHERE user_id = 6;

CREATE TABLE final_user_last_job_activities (
    user_id bigint,
    touched_at timestamp,
    job_id bigint,
    PRIMARY KEY (user_id, touched_at)
) 
WITH CLUSTERING ORDER BY (touched_at DESC)
AND default_time_to_live = 604800;

INSERT INTO final_user_last_job_activities (user_id, touched_at, job_id) VALUES (5, dateof(now()), 5);
INSERT INTO final_user_last_job_activities (user_id, touched_at, job_id) VALUES (5, dateof(now()), 6);
INSERT INTO final_user_last_job_activities (user_id, touched_at, job_id) VALUES (5, dateof(now()), 7);
INSERT INTO final_user_last_job_activities (user_id, touched_at, job_id) VALUES (5, dateof(now()), 6);

SELECT * FROM final_user_last_job_activities LIMIT 1;

这给了我：

 user_id | touched_at               | job_id
---------+--------------------------+--------
       5 | 2015-06-17 12:43:30+1200 |      6

简单的基准测试在存储或从更大的表中读取时没有显著的性能差异。

共有1个答案

林富

2023-03-14

因为C*是最后的write wins，所以您可以简单地保留每行的最新版本。

正如MSD所建议的，您可以使用writetime提取写入时间。但是要小心，因为这是特定于列的，并且不能在主键列上使用写时间。例如，在如下表中：

cqlsh> create TABLE test.test ( a int, b int, c int, d int, primary key (a))
   ... ;
cqlsh> insert INTO  test.test (a, b, c, d) VALUES ( 1,2,3,4)
   ... ;

cqlsh> select * from test.test
   ... ;

 a | b    | c | d
---+------+---+------
 1 |    2 | 3 |    4

(2 rows)

cqlsh> insert into test.test (a,c) values (1, 6);
cqlsh> select * from test.test ;

 a | b    | c | d
---+------+---+------
 1 |    2 | 6 |    4

(2 rows)
cqlsh> select writetime(a), writetime(b), writetime(c), writetime(d) from test.test
   ... ;
InvalidRequest: code=2200 [Invalid query] message="Cannot use selection function writeTime on PRIMARY KEY part a"

cqlsh> select  writetime(b), writetime(c), writetime(d) from test.test  ;

 writetime(b)     | writetime(c)     | writetime(d)
------------------+------------------+------------------
 1434424690700887 | 1434424690700887 | 1434424702420929

否则，可以添加具有时间戳的cql列：

create TABLE test.test ( a int, b int, c int, d int, touched_at timeuuid, primary key (a)) ;

类似资料：

在CouchDB中存储日期时间（时间戳）的最佳方法是什么？

问题内容：我在想这样的UTC时间字符串可能是可以的，因为如果在视图键中使用它们，则可以正确排序，但是存储时区（例如）会使文档更具可读性。从可读性的角度来看，将日期转换为纪元整数似乎没有什么吸引力，但对于性能而言可能是最好的选择（或者是否有所作为？）。这里推荐的做法是什么？问题答案：时间是一维的东西。时间戳加上时区是二维的，描述了时间点和位置。Couch视图是一维的（但不是GeoCouch插件
在Postgresql中将时间存储在24:00:00以上的最佳方法？

问题内容：我正在将GTFS提要存储到SQL数据库中，并且预计某些时间会存储在时间值上限24:00:00之上。例如，某些火车在上午12:30开行，但列出了前几天的服务，在GTFS规范中，该行车时间被存储为24:30。解决这个问题的最佳方法是什么？我应该将其存储为字符串吗？问题答案：建议为此使用int …您的值可能是：对于24:30:00，您将获得88200。从数据库加载值时，可以通过简单
在数据库中存储IP的最佳方法？

问题内容：在MySQL数据库中存储IP地址的最佳字段类型和长度是什么？ IPv6呢？问题答案：将IP存储为，然后使用和功能存储/检索IP地址。样例代码：
储存工作时间并有效查询的最佳方法

问题内容：我打算存储商店的工作时间。我想知道在工作时间字段中最好的建模方法是什么，这样我就可以以非常有效的方式获得当前时刻开/关商店的列表。问题答案：要存储正常的工作时间，您需要存储一些记录，其中包含：商店-INTEGER DayOfWeek-整数（0-6）营业时间-TIME 关闭时间-TIME 例如，我假设每个商店在国定假日减少工作时间或关闭工厂，因此您还需要存储一些替代记录：商店-
在java中最接近0.05的最佳方法

有一项政策规定，一个项目的税收应该四舍五入到最接近的0.05。因此，1.499应四舍五入至1.5，7.125应四舍五入至7.25。上述四舍五入要求可以使用以下逻辑实现：把税加到该项目的成本上就会产生：我尝试使用BigDecimal而不是float来存储所有的值，并将刻度设置为小数点后2位。这种方法的问题是，如果没有指定舍入策略，bigDecimal将在某些情况下引发异常。为BigDecima
存储Redis密钥的最佳方法

问题内容：我正在使用Redis来存储一些信息并检测该信息随时间的变化（例如，考虑用户和位置）。使用更长或更短的键名的值是什么？使用更长的键会更清楚，但是使用更长的键名是否会在内存或性能上付出很多成本？以下是示例：要么问题答案：这完全取决于您将如何使用它。如果每个字节都很重要，例如，当您必须为传输到云服务的每个kB支付费用时，您可以计算成本。数学很简单；一个字节是“在线”上的一个字节。在r

在Cassandra中存储最后一次接触时间的最佳方法

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档