当前位置: 首页 > 面试题库 >

重用计算出的选择值

陶璞
2023-03-14
问题内容

我正在尝试使用ST_SnapToGrid,然后GROUP BY使用网格单元格(x,y)。这是我首先要做的:

SELECT
  COUNT(*)                      AS n,
  ST_X(ST_SnapToGrid(geom, 50)) AS x,
  ST_Y(ST_SnapToGrid(geom, 50)) AS y
FROM points
GROUP BY x, y

我不想ST_SnapToGridx和重新计算y。所以我将其更改为使用子查询:

SELECT
  COUNT(*)   AS n,
  ST_X(geom) AS x,
  ST_Y(geom) AS y
FROM (
  SELECT 
      ST_SnapToGrid(geom, 50) AS geom
  FROM points
) AS tmp
GROUP BY x, y

但是,当我运行时EXPLAIN,这两个查询都具有完全相同的执行计划:

GroupAggregate  (...)
  ->  Sort  (...)
        Sort Key: (st_x(st_snaptogrid(points.geom, 0::double precision))), (st_y(st_snaptogrid(points.geom, 0::double precision)))
        ->  Seq Scan on points  (...)

问题 :PostgreSQL会重用的结果值ST_SnapToGrid()吗?
如果没有,是否有办法做到这一点?


问题答案:

测试时间

您不会在EXPLAIN输出中看到每行各个功能的评估。

测试EXPLAINANALYZE以获取实际查询时间以比较总体效果。运行几次以排除缓存工件。对于像这样的简单查询,可以通过以下方式获得整个运行时的更可靠的数字:

EXPLAIN (ANALYZE, TIMING OFF) SELECT ...

需要Postgres 9.2+
。每个文档:

TIMING

在输出中包括实际的启动时间和在每个节点上花费的时间。重复读取系统时钟的开销可能会在某些系统上显着降低查询速度,因此将此参数设置为FALSE仅需要实际行计数而不是确切时间时可能会很有用。即使使用此选项关闭了节点级计时,也始终会测量整个语句的运行时间。仅当ANALYZE同时启用此参数时,才可以使用此参数。默认为TRUE

防止重复评估

通常,子查询中的表达式只计算 一次 。但是,如果Postgres认为这样做会更快,那么它可以使琐碎的子查询崩溃。

要引入优化障碍,可以使用
CTE

代替子查询。这 保证 了PostgresST_SnapToGrid(geom, 50)仅计算一次:

WITH cte AS (
   SELECT ST_SnapToGrid(geom, 50) AS geom1
   FROM   points
   )
SELECT COUNT(*)   AS n
     , ST_X(geom1) AS x
     , ST_Y(geom1) AS y
FROM   cte
GROUP  BY geom1;         -- see below

但是,由于CTE的开销较大,因此它可能比子查询
。函数调用可能非常便宜。通常,Postgres会更好地了解如何优化查询计划。如果您更了解,请仅引入这样的优化障碍。

简化

我在子查询/ CTE中更改了计算点的名称,geom1以阐明它与原始查询点的不同geom。这有助于在这里澄清 更重要的 事情:

GROUP BY geom1

代替:

~~GROUP BY x, y~~

这显然更便宜-可能会影响函数调用是否重复。因此,这可能是最快的:

SELECT COUNT(*) AS n
     , ST_X(ST_SnapToGrid(geom, 50)) AS x
     , ST_y(ST_SnapToGrid(geom, 50)) AS y
FROM   points
GROUP  BY ST_SnapToGrid(geom, 50);         -- same here!

也许这样:

SELECT COUNT(*)    AS n
     , ST_X(geom1) AS x
     , ST_y(geom1) AS y
FROM (
   SELECT ST_SnapToGrid(geom, 50) AS geom1
   FROM   points
   ) AS tmp
GROUP  BY geom1;

EXPLAIN ANALYZE或测试这三个,EXPLAIN (ANALYZE, TIMING OFF)然后自己看看。测试>>猜测。



 类似资料:
  • 问题内容: 我有一张包含所有美国邮政编码的表格。每行包含邮政编码的城市和州名称。我正在尝试获取在多个州显示的城市列表。如果在同一座城市中没有X个邮政编码,这将不是问题。 所以基本上,我只想将一个州的城市计数为1,而不是将城市/州计数为7次,因为该城市/州中有2个以上的邮政编码… 我不太确定该怎么做。我知道我需要使用count,但是如何告诉mysql仅将给定的城市/州组合计数为1? 问题答案: SE

  • 基本上,对于每个user_id,我需要类似的东西, 我想最终的结果只是返回所有的总数。

  • 我想计算选择属性中的选项,但我的测试失败了,这是我的规范: 它给了我错误: C:\wamp\www\First-angular-App

  • 我希望在输入值字段中输出选项中的值。因此,如果我选择红色,我希望在输入值中输出红色

  • 问题内容: 我正在尝试从以下查询中获取行数。我只得到行计数为1,但有35条记录。您能否让我知道如何从内部查询中获取计数? 谢谢 问题答案: 您缺少FROM,需要为子查询指定别名。

  • 第一种方法: SetRebootFlag true IfRebootFlag 0 +2 同时如果有!define MUI_FINISHPAGE_NOREBOOTSUPPORT 记得删掉 第二种方法: 可以跳出窗口询问 MessageBox MB_YESNO|MB_ICONQUESTION|MB_TOPMOST "请重启以便补丁安装完全及垃圾清理完整!" IDNO +2 Reboot