需要有关SQL中复杂的Join语句的帮助

危斯伯

2023-03-14

问题内容：

您如何在一个日期稀疏的表与另一个日期详尽的表之间进行联接，以使稀疏日期之间的间隔取前一个稀疏日期的值？

说明性示例：

PRICE table (sparse dates):
date        itemid  price
2008-12-04  1       $1
2008-12-11  1       $3
2008-12-15  1       $7


VOLUME table (exhaustive dates):
date         itemid  volume_amt
2008-12-04   1       12345
2008-12-05   1       23456
2008-12-08   1       34567
2008-12-09   1       ...
2008-12-10   1
2008-12-11   1
2008-12-12   1
2008-12-15   1
2008-12-16   1
2008-12-17   1
2008-12-18   1

所需结果：

date       price  volume_amt
2008-12-04 $1     12345
2008-12-05 $1     23456
2008-12-08 $1     34567
2008-12-09 $1     ...
2008-12-10 $1
2008-12-11 $3
2008-12-12 $3
2008-12-15 $7
2008-12-16 $7
2008-12-17 $7
2008-12-18 $7

更新：

几个人提出了可以完成所需结果的相关子查询。（相关子查询=包含对外部查询的引用的子查询。）

这将起作用；但是，我应该注意到，我使用的平台是MySQL，其相关子查询的优化效果很差。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。有没有使用相关子查询的任何方法？

问题答案：

这不像向稀疏表中的单个LEFT OUTER JOIN那样简单，因为您希望用最新的价格填充外部联接留下的NULL。

EXPLAIN SELECT v.`date`, v.volume_amt, p1.item_id, p1.price
FROM Volume v JOIN Price p1
  ON (v.`date` >= p1.`date` AND v.item_id = p1.item_id)
LEFT OUTER JOIN Price p2
  ON (v.`date` >= p2.`date` AND v.item_id = p2.item_id
    AND p1.`date` < p2.`date`)
WHERE p2.item_id IS NULL;

该查询将“成交量”与“价格”中所有较早的行匹配，然后使用另一个联接来确保我们仅找到最新的价格。

我在MySQL 5.0.51上进行了测试。它既不使用相关子查询，也不使用分组依据。

编辑： 更新查询以匹配item_id以及日期。这似乎也可行。我在(date)和上创建了一个索引，(date, item_id)并且EXPLAIN计划是相同的。(item_id, date)在这种情况下，索引为on可能更好。这是EXPLAIN的输出：

+----+-------------+-------+------+---------------+---------+---------+-----------------+------+--------------------------------------+
| id | select_type | table | type | possible_keys | key     | key_len | ref             | rows | Extra                                |
+----+-------------+-------+------+---------------+---------+---------+-----------------+------+--------------------------------------+
|  1 | SIMPLE      | p1    | ALL  | item_id       | NULL    | NULL    | NULL            |    6 |                                      | 
|  1 | SIMPLE      | v     | ref  | item_id       | item_id | 22      | test.p1.item_id |    3 | Using where                          | 
|  1 | SIMPLE      | p2    | ref  | item_id       | item_id | 22      | test.v.item_id  |    1 | Using where; Using index; Not exists | 
+----+-------------+-------+------+---------------+---------+---------+-----------------+------+--------------------------------------+

但是我的数据集很小，优化可能取决于较大的数据集。您应该尝试使用更大的数据集来分析html" target="_blank">优化。

编辑： 我之前粘贴了错误的EXPLAIN输出。上面的一个已更正，并且显示了(item_id, date)索引的更好使用。

需要有关SQL中复杂的Join语句的帮助

相关阅读

相关文章

相关问答

相关工具

相关文档