当前位置: 首页 > 知识库问答 >
问题:

如何在SQL中返回数据集特定分辨率(均匀分布)的记录

贾骏喆
2023-03-14

我面对的数据库中有很多条目(大约1900万个)。在我的服务器上,查询大约需要20秒,并返回大量结果。但是在前端(一个图表)中,我不需要每一行,所以我的想法是只返回结果行的100个元素。但不包括前100个或后100个:这些行的100个均匀分布的元素。换句话说,我希望能够指定数据的分辨率。

这里有一些伪代码。

SELECT time, type, value
FROM [table_name]
WHERE time >= [start_date] AND
      time <= [end_date] AND
      type = [any_type]
LIMIT 100 UNIFORMLY DISTRIBUTED OVER RESULTS;

对于如何编写此查询,您有什么想法吗?这有可能吗?

共有1个答案

汪同
2023-03-14

您可以如下使用分析性funcrion count和row_number(请根据您的数据库使用函数和语法):

Select * from
(SELECT time, type, value,
       Row_number(1) over (order by time) as rn,
       Count(1) over() as cnt
FROM [table_name]
WHERE time >= [start_date] AND
      time <= [end_date] AND
      type = [any_type]) t
Where mod(rn,trunc(cnt/100)) = 0
Order by time limit 100
 类似资料:
  • 0.1-0.2:********** 0.2-0.3:******** 0.3-0.4:********* 0.5-0.6:********* 0.6-0.7:********* 0.7-0.8:********* 0.4-0.5:********* 0.5-0.6:********* 0.6-0.7:********* 0.1-0.2:********* 0.2-0.3:********* 0.

  • 我们在AWS上运行16个节点kafka集群,每个节点是m4. xLargeEC2实例,具有2TB EBS(ST1)磁盘。Kafka版本0.10.1.0,目前我们有大约100个主题。一些繁忙的话题每天会有大约20亿个事件,一些低量的话题每天只有数千个。 我们的大多数主题在生成消息时使用UUID作为分区键,因此分区分布相当均匀。 我们有相当多的消费者使用消费群体从这个集群消费。每个使用者都有一个唯一的

  • 我有9个ignite服务器实例,其缓存处于模式,在这种模式下,我用Kafka从分区并行加载数据。这里的分区包含的条目数可以通过字段唯一标识,我还使用将条目从一个分区配置到一个实例。我将key定义为, 因此,我试图在ignite实例中的缓存项和分区之间实现一对一的映射,例如。但在我的例子中,我得到的映射是, 这里实现了关联配置部分,即具有相同分区ID的条目缓存在相同的ignite实例上。但是,数据在

  • 问题内容: 我知道如果我使用Java的Random生成器,并使用nextInt生成数字,则数字将均匀分布。但是,如果我使用2个Random实例,并使用两个Random类生成数字,会发生什么。数字是否会均匀分布? 问题答案: 每个实例生成的数字将均匀分布,因此,如果将两个实例生成的随机数序列组合在一起,则它们也应均匀分布。 请注意,即使结果分布是均匀的,您也可能要注意种子,以避免两个生成器的输出之间

  • 问题内容: 我试图识别/创建一个函数(在Java中),该函数给我一个非均匀的分布式数字序列。如果我有一个函数说它将给我一个从到的随机数。 该函数最适合任何给定的函数,下面仅是我想要的示例。 但是,如果我们说函数将返回来自分布式的s nonuni。 我想例如说 约占所有案件的20%。 大约是所有情况的50%。 约占所有案件的20%。 大约是所有情况的10。 总之somting,给我一个数字,如正态分

  • 我有一个有 30 条记录的 RDD(键/值对:键是时间戳,值是 JPEG 字节数组), 我正在运行 30 个执行器。我想将此 RDD 重新分区为 30 个分区,以便每个分区获得一条记录并分配给一个执行器。 当我使用 30) 时,它会在 30 个分区中重新分区我的 rdd,但有些分区得到 2 条记录,有些得到 1 条记录,有些没有得到任何记录。 在Spark中,有没有什么方法可以将我的记录平均分配到

  • 我试图把一些代码,将做同样的Python, Numpy.random.选择 关键部分是: 与a中的每个条目相关的概率。如果没有给定,则样本假定a中所有条目的均匀分布。 一些测试代码: 这将产生以下输出: 有时候。 这里有一个分布,它是部分随机的,但也有结构。 我想在C#中实现这一点,老实说,我不确定是否有有效的方法来实现。 大约4年前,有一个很好的问题被提出:模仿Python的随机性。选择。网 因