问题：

如何在SQL中返回数据集特定分辨率（均匀分布）的记录

贾骏喆

2023-03-14

我面对的数据库中有很多条目（大约1900万个）。在我的服务器上，查询大约需要20秒，并返回大量结果。但是在前端（一个图表）中，我不需要每一行，所以我的想法是只返回结果行的100个元素。但不包括前100个或后100个:这些行的100个均匀分布的元素。换句话说，我希望能够指定数据的分辨率。

这里有一些伪代码。

SELECT time, type, value
FROM [table_name]
WHERE time >= [start_date] AND
      time <= [end_date] AND
      type = [any_type]
LIMIT 100 UNIFORMLY DISTRIBUTED OVER RESULTS;

对于如何编写此查询，您有什么想法吗？这有可能吗？

共有1个答案

汪同

2023-03-14

您可以如下使用分析性funcrion count和row_number（请根据您的数据库使用函数和语法）:

Select * from
(SELECT time, type, value,
       Row_number(1) over (order by time) as rn,
       Count(1) over() as cnt
FROM [table_name]
WHERE time >= [start_date] AND
      time <= [end_date] AND
      type = [any_type]) t
Where mod(rn,trunc(cnt/100)) = 0
Order by time limit 100

类似资料：

均匀分布不给出均匀分布

0.1-0.2:********** 0.2-0.3:******** 0.3-0.4:********* 0.5-0.6:********* 0.6-0.7:********* 0.7-0.8:********* 0.4-0.5:********* 0.5-0.6:********* 0.6-0.7:********* 0.1-0.2:********* 0.2-0.3:********* 0.
分区分布不均匀

我们在AWS上运行16个节点kafka集群，每个节点是m4. xLargeEC2实例，具有2TB EBS（ST1）磁盘。Kafka版本0.10.1.0，目前我们有大约100个主题。一些繁忙的话题每天会有大约20亿个事件，一些低量的话题每天只有数千个。我们的大多数主题在生成消息时使用UUID作为分区键，因此分区分布相当均匀。我们有相当多的消费者使用消费群体从这个集群消费。每个使用者都有一个唯一的
Ignite实例间数据的均匀分布

我有9个ignite服务器实例，其缓存处于模式，在这种模式下，我用Kafka从分区并行加载数据。这里的分区包含的条目数可以通过字段唯一标识，我还使用将条目从一个分区配置到一个实例。我将key定义为，因此，我试图在ignite实例中的缓存项和分区之间实现一对一的映射，例如。但在我的例子中，我得到的映射是，这里实现了关联配置部分，即具有相同分区ID的条目缓存在相同的ignite实例上。但是，数据在
随机分布均匀

问题内容：我知道如果我使用Java的Random生成器，并使用nextInt生成数字，则数字将均匀分布。但是，如果我使用2个Random实例，并使用两个Random类生成数字，会发生什么。数字是否会均匀分布？问题答案：每个实例生成的数字将均匀分布，因此，如果将两个实例生成的随机数序列组合在一起，则它们也应均匀分布。请注意，即使结果分布是均匀的，您也可能要注意种子，以避免两个生成器的输出之间
随机数，分布不均匀

问题内容：我试图识别/创建一个函数（在Java中），该函数给我一个非均匀的分布式数字序列。如果我有一个函数说它将给我一个从到的随机数。该函数最适合任何给定的函数，下面仅是我想要的示例。但是，如果我们说函数将返回来自分布式的s nonuni。我想例如说约占所有案件的20％。大约是所有情况的50％。约占所有案件的20％。大约是所有情况的10。总之somting，给我一个数字，如正态分
火花重新分区不均匀分布记录
火花：如何在所有分区中均匀分配我的记录

我有一个有 30 条记录的 RDD（键/值对：键是时间戳，值是 JPEG 字节数组），我正在运行 30 个执行器。我想将此 RDD 重新分区为 30 个分区，以便每个分区获得一条记录并分配给一个执行器。当我使用 30）时，它会在 30 个分区中重新分区我的 rdd，但有些分区得到 2 条记录，有些得到 1 条记录，有些没有得到任何记录。在Spark中，有没有什么方法可以将我的记录平均分配到
Python numpy。随机的具有非均匀/均匀概率分布的C#中的选择

我试图把一些代码，将做同样的Python， Numpy.random.选择关键部分是：与a中的每个条目相关的概率。如果没有给定，则样本假定a中所有条目的均匀分布。一些测试代码：这将产生以下输出：有时候。这里有一个分布，它是部分随机的，但也有结构。我想在C#中实现这一点，老实说，我不确定是否有有效的方法来实现。大约4年前，有一个很好的问题被提出：模仿Python的随机性。选择。网因

如何在SQL中返回数据集特定分辨率（均匀分布）的记录

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档