当前位置: 首页 > 面试题库 >

如何使用此异常匹配条件编写联接?

仲孙逸明
2023-03-14
问题内容

我想“左连接”一个表,以便将值不仅连接到匹配的行,而且还连接到任何后续的不匹配的行,直到下一个匹配的行。换句话说,我想用先前的非空值填充空值。

样本数据和所需结果:

x

 id 
----
  1
  2
  3
  4
  5

y

 id | val 
----+-----
  1 | a
  4 | b

结果select x.id, y.val from x left join y on x.id=y.id order by x.id;

 id | val 
----+-----
  1 | a
  2 | 
  3 | 
  4 | b
  5 |

所需结果:

 id | val 
----+-----
  1 | a
  2 | a
  3 | a
  4 | b
  5 | b

问题答案:

指标

x.id和上创建索引y.id-如果这些是您的主键,则可能已经有了。
多列索引也可能有所帮助,尤其是在pg 9.2+中仅索引扫描的情况下:

CREATE INDEX y_mult_idx ON y (id DESC, val)

但是,在我的测试中,最初没有使用此索引。必须添加(否则毫无意义)valORDER BY说服查询计划者排序顺序匹配。参见查询 3

该指数在这种合成设置中几乎没有什么区别。但是对于具有更多列的表,val从表中检索变得越来越昂贵,从而使“覆盖”索引更具吸引力。

查询

1)简单

SELECT DISTINCT ON (x.id)
       x.id, y.val
FROM   x
JOIN   y ON y.id <= x.id
ORDER  BY x.id, y.id DESC;

SQL提琴。

DISTINCT在此相关答案中对该技术的更多说明:

  • 在每个GROUP BY组中选择第一行?

我进行了一些测试,因为我怀疑第一个查询无法很好地扩展。小桌子很快,但是大桌子不好。Postgres并未优化计划,而是以(有限的)交叉联接开始,成本为O(N虏)

2)快速

该查询仍然非常简单,并且可以很好地扩展:

SELECT x.id, y.val
FROM   x
JOIN  (SELECT *, lead(id, 1, 2147483647) OVER (ORDER BY id) AS next_id FROM y) y
       ON  x.id >= y.id
       AND x.id <  y.next_id
ORDER  BY 1;

窗口功能lead()很有用。我使用该选项来提供默认值以覆盖最后一行的特殊情况:2147483647是可能的最大整数。适应您的数据类型。

3)非常简单,几乎一样快

SELECT x.id
     ,(SELECT val FROM y WHERE id <= x.id ORDER BY id DESC, **val** LIMIT 1) AS val
FROM   x;

通常, 相关的子查询 往往很慢。但这只不过可以从(覆盖)索引中选择一个值,否则就很容易竞争。

附加ORDER BYval(粗体强调)似乎毫无意义。但是添加它可以使查询计划者确信可以y_mult_idx从上方使用多列索引,因为排序顺序是匹配的。注意

仅索引使用y_mult_idx进行扫描。

EXPLAIN输出中。

测试用例

经过激烈的辩论和多次更新,我收集了迄今为止发布的所有查询,并提供了一个测试用例以进行快速概述。我只使用1000行,因此SQLfiddle不会因较慢的查询而超时。但是在我所有的本地测试中,前4位(Erwin
2,Clodoaldo,a_horse,Erwin 3)都是线性增长的。再次更新以包括我最新添加的内容,现在通过性能改进格式和顺序:

Big SQL Fiddle 比较性能。



 类似资料:
  • 问题内容: 我有一个用于Elasticsearch的简单JSON查询,如下所示: 仅当值(在这种情况下为“ a1”)不为空时,才如何执行第二个“必须”条件? 问题答案: 您可以使用以下方法实现它-

  • 问题内容: 我正在将JPA 2.0与Hibernate 4.1.0.Final一起使用。我有几个类,Groups和GroupMembers。每个GroupMember都绑定到一个用户对象 是否有可能编写给定User对象的java.util.Set的JPA标准查询,该查询将返回其成员与该Set完全匹配的组?我尝试了以下… 但是它失败了,但… 问题答案: 每个用户都将需要不同的根,因为每个根都与其他用

  • 我创建了一个类,其中包含“继任者”方法(见下文)。我想在另一种方法中使用下一个条件: (基本上是一个条件,如果同一索引的继任者不返回异常,则返回true)。

  • 我正在尝试为这样的情况编写测试用例,在这个情况下,我期待的是datatruncation异常,我试图使用assert equals和比较消息来断言相同的情况,但是看起来像是比较两个字符串,有没有更好的方法来为这样的异常编写测试用例。 我正在使用JUnit5

  • 今天在编程课上我们从streams和Lambda开始,我要做一个练习。 第一个任务是编写一个方法,计算列表中偶数的平均值。我已经编写了这段代码,但显然我没有使用流。 编辑解决方案: 第二个任务是编写一个方法,选择所有以“a”(不区分大小写)开头或有3个字符的字符串,并将其更改为大写。我的代码: 编辑:解决方案: 最后一个任务是返回列表,但将“g”添加到偶数,将“u”添加到奇数。我的代码: 编辑:解