当前位置: 首页 > 面试题库 >

基于SQL集的范围

闾丘选
2023-03-14
问题内容

我如何让SQL重复一些基于集合的操作任意次数而不会循环?如何让SQL对一定范围的数字执行运算?我基本上是在寻找一种基于集合的for循环的方法。

我知道我可以创建一个包含整数(例如1到1000)的小表,然后将其用于该范围内的范围操作。

例如,如果我有该表,则可以选择查找数字100-200的总和,如下所示:

select sum(n) from numbers where n between 100 and 200

有任何想法吗?我有点在寻找适用于T-SQL的东西,但是任何平台都可以。


问题答案:

我认为对您的问题的简短回答是使用WITH子句来生成您自己的子句。

不幸的是,数据库中的大人物没有内置的可查询的数字范围伪表。或者,更一般而言,简单的纯SQL数据生成功能。我个人认为这是一个 巨大的
失败,因为如果这样做,则有可能将当前锁定在过程脚本(T-SQL,PL / SQL等)中的许多代码迁移到纯SQL中,从而对性能和代码复杂性有很多好处。

因此,总的来说,听起来您需要的是即时生成数据的能力。

Oracle和T-
SQL都支持可用于执行此操作的WITH子句。它们在不同的DBMS中的工作方式略有不同,MS称它们为“公用表表达式”,但是它们的形式非常相似。将它们与递归结合使用,可以相当容易地生成数字或文本值的序列。这是可能的样子…

在Oracle SQL中:

WITH
  digits AS  -- Limit recursion by just using it for digits.
    (SELECT
      LEVEL - 1 AS num
    FROM
      DUAL
    WHERE
      LEVEL < 10
    CONNECT BY
      num = (PRIOR num) + 1),
  numrange AS
    (SELECT
      ones.num
        + (tens.num * 10)
        + (hundreds.num * 100)
        AS num
    FROM
      digits ones
      CROSS JOIN
        digits tens
      CROSS JOIN
        digits hundreds
    WHERE
      hundreds.num in (1, 2)) -- Use the WHERE clause to restrict each digit as needed.
SELECT
  -- Some columns and operations
FROM
  numrange
  -- Join to other data if needed

诚然,这很冗长。Oracle的递归功能受到限制。语法笨拙,性能不佳,并且仅限于500个(我认为)嵌套级别。这就是为什么我选择仅对前10个数字使用递归,然后再使用交叉(笛卡尔)联接将它们组合成实际数字。

我自己没有使用SQL Server的Common Table
Expressions,但是由于它们允许自引用,因此与Oracle相比,递归要简单得多。我不知道性能是否具有可比性,以及嵌套限制是多少。

无论如何,递归和WITH子句在创建需要即时生成的数据集的查询时都是非常有用的工具。然后,通过查询该数据集,对值进行操作,您可以获得各种不同类型的生成数据。聚合,重复,组合,排列等。您甚至可以使用此类生成的数据来帮助汇总或深入研究其他数据。

更新:
我只想补充一点,一旦您开始以这种方式使用数据,它就会使您想到新的SQL思考方式。它不仅是一种脚本语言。这是一种相当强大的数据驱动的声明性语言。有时使用起来很痛苦,因为多年来它缺少增强功能以​​帮助减少复杂操作所需的冗余。但是,它非常强大,并且是一种非常直观的方式来处理数据集,将其作为算法的目标和驱动程序



 类似资料:
  • 问题内容: 我有一个像这样的表 我想创建一个视图,以下列格式提供数据 我对视图不够熟悉,所以我需要一些指导。 谢谢 问题答案: 您可以使用递归CTE完成此操作

  • 问题内容: 我有一个表,其中每一行都有开始和结束日期时间。这些可以是短跨度或长跨度。 我想查询具有两个开始和停止日期时间的所有行的交集的总持续时间。 如何在MySQL中做到这一点? 还是必须选择与查询开始和结束时间相交的行,然后计算每行的实际重叠并将其累加到客户端? 举个例子,使用毫秒使它更清晰: 一些行: 我们想知道这些行在1030和1100之间的总时间。 让我们计算每行的重叠: 因此,本例中的

  • 这是从2011年开始对这个问题的扩展:基于范围的for loops和ADL 使用Visual Studio 2015,我无法使用参数依赖查找(ADL)为自定义容器创建基于范围的for循环。 我在下面用一个自定义容器做了一个非常简单的测试用例: 使用此容器和ADL,以下测试可以很好地编译: 这是应该的。我不确定ADL是否在这里得到了利用,但无论如何,它是有意义的。根据MSDN文档,我们有: 请记住以

  • 我正在尝试基于第二个数据框的值周围的范围创建一个数据框的子集,我一直在进行研究,但我就是想不出如何去做。我在这里使用了虚拟数据,因为它们都是包含许多列的大型数据集。 数据帧1(df1)有50列,数千条不同纬度的记录 数据帧2(df2)有数百个城镇,都位于不同纬度,比df1小得多 我需要df1的一个子集,它只包括纬度在df2纬度0.01范围内的行。所以代码需要查看df1的每一行,并根据df2的每一行

  • 由于valgrind中出现了一些分段错误和警告,我发现这段代码不正确,并且在for range循环中有一些悬而未决的引用。 看起来好像开始和结束是从一个临时循环中提取的,并且在循环中丢失了。 当然,一种方法是 然而,我想知道为什么for(auto e:f()[5])是一个错误,以及是否有更好的方法或某种方法来设计f,甚至容器(

  • 问题内容: 我最近一直念叨如何和作品。我的理解很简单(如果有错,请纠正我): 的数据结构,其背和IS :根据索引列(或键)对数据进行物理排序。每个只能有一个。如果在创建表的过程中未指定No ,则服务器将在上自动创建一个。 问题1 :由于数据是根据索引进行物理排序的,因此这里不需要额外的空间。这样对吗?那么,当我删除创建的索引时会发生什么? :在中,树的包含列值和指向数据库中实际行的指针(行定位符)