当前位置: 首页 > 面试题库 >

更新语句中的冗余数据

叶德本
2023-03-14
问题内容

Hibernate会生成UPDATE包含所有列的语句,无论我是否更改了这些列中的值,例如:

tx.begin();
Item i = em.find(Item.class, 12345);
i.setA("a-value");
tx.commit();

发表以下UPDATE声明:

update Item set A = $1, B = $2, C = $3, D = $4 where id = $5

因此B,C,D列已更新,而我没有更改它们。

说,项目会经常更新,并且所有列都已建立索引。 问题是:将Hibernate部分优化为如下所示是否有意义:

tx.begin();
em.createQuery("update Item i set i.a = :a where i.id = :id")
    .setParameter("a", "a-value")
    .setParameter("id", 12345)
    .executeUpdate();
tx.commit();

最让我困惑的是,EXPLAIN“未优化”和“优化”查询版本的计划是相同的!


问题答案:

由于PostgreSQL MVCC,an
UPDATE实际上更像是DELETEplus INSERT。除了烘烤值的显着例外-请参阅:

  • Postgres是否在更新时重写整行?

(和仅堆元组的微小差异- DELETE+ INSERT启动了一个新的HOT链-但这与手头的情况无关。)

准确地说,“删除”行对于提交删除之后开始的任何事务来说都是不可见的,以后再进行清理。因此,在数据库方面,包括索引操作,实际上这两个语句之间 没有区别
。(有例外,请继续阅读。)这会稍微增加网络流量(取决于您的数据),并且需要一些解析。

在@araqnid输入之后,我研究了HOT更新,并进行了一些测试。就HOT更新而言, 实际上不更改值的 列更新 没有任何区别
。我的答案成立。请参阅下面的详细信息。

这也适用于烘烤的属性,因为除非值 实际更改, 否则它们也不会被触摸。

但是 ,如果您使用 每列触发器 (第9.0页介绍),则可能会有不希望的副作用!

我引用了有关触发器的手册:

…这样的命令UPDATE ... SET x = x ...将在列上触发触发器x即使该列的值未更改也是如此

大胆强调我的。

抽象层是为了方便。它们对于不懂SQL的开发人员或在不同RDBMS之间需要可移植的应用程序很有用。不利的一面是,它们可能会削弱性能并引入其他故障点。我会尽可能避免它们。

HOT(仅堆元组)更新

Postgres
8.3引入了仅堆元组,在8.3.4和8.4.9中进行了重要改进。
Postgres 8.3的发行说明:

UPDATEs和DELETEs留下死元组,失败的INSERTs也是如此。以前只能VACUUM回收死元组占用的空间。使用HOT死元组空间可以在INSERTUPDATE
在未更改索引 时自动回收 。这样可以实现更一致的性能。同样,HOT避免添加重复的索引条目。

强调我的。并且“无更改”包括使用相同的值更新列的情况。我不确定, 实际上已经测试过

最终,源代码中广泛的README.HOT确认了这一点。

烤列也不会妨碍HOT更新。HOT更新的元组仅链接到关系的吐司中的相同,未更改的元组。HOT更新甚至可以与目标列表中的烘烤值(实际上是否更改)一起工作。如果更改了烘烤值,则显然需要对烘烤关系叉进行写操作。我也测试了所有这些。

不要相信我,自己去看看。Postgres提供了一些检查统计信息的功能。在UPDATE有和没有所有列的情况下运行您的应用程序,并检查是否有任何不同。

-- Number of rows HOT-updated in table:
SELECT pg_stat_get_tuples_hot_updated('table_name'::regclass::oid)

-- Number of rows HOT-updated in table, in the current transaction:
SELECT pg_stat_get_xact_tuples_hot_updated('table_name'::regclass::oid)

或使用pgAdmin。选择表并检查主窗口中的“统计”选项卡。

请注意,只有在主关系分支的同一页上有新元组版本的空间时,才可以进行HOT更新。强制该条件的一种简单方法是使用仅容纳几行的小表进行测试。页面大小通常为8k,因此页面上必须有可用空间。



 类似资料:
  • 我是java新手,受这次讨论的启发,我在这里写了一个while循环版本和一个for循环版本(这个问题),这个程序在数组中搜索一个“项”(在main方法中称为int 20)并返回其值,这两个版本都有效。 然而,在这个for循环版本中,第二个if语句,尤其是“database[i]==database[database.length-1]”,看起来是多余的,因为for循环中的终止条件已经指定 我尝试用

  • 问题内容: 有人可以给我一个SQL查询来帮助我清理此表吗?在清除locid(索引)后,应该重新设置,这是使用此查询的县城 。当我通过phpmyadmin的导入多次导入sql文本时,就会出现这种冗余数据,这就是结果, 问题答案: 在表位置添加唯一索引,这样就不会插入重复的记录 这将自动从表中删除重复的记录,对于以后的插入查询,您需要使用子句来避免出现重复的错误。 但正如注释中所建议的那样,它可能不适

  • 问题内容: 我有2个表格,Products和ShoppingCart,我想根据ShoppingCart中指定的产品名称和数量来更新和减少Products表中产品的“数量”。我怎样才能做到这一点? 表:产品字段:产品名称,产品数量 表:购物车字段:ProductName,ProductQty 访问数据库 问题答案: 您应该有一个产品ID。然而: 您还应该在字段和表名中删除空格。

  • 问题内容: 抱歉,标题不清楚。基本上,我试图从多个表中选择某些记录,然后为返回的记录更新某个列值。 T-SQL实施 甲骨文 我尝试在Teradata中执行与在Oracle中相同的操作,但是出现以下错误: 我在网上寻找解决方案,但没有运气。 问题答案: 您是否使用Teradata尝试了以下语法:

  • 我如何避免在这里过度使用试捕?我如何简化裁员

  • 问题内容: 我有一个很大的PostgreSQL表,可以通过Django访问。因为Django的ORM不支持窗口函数,所以我需要将窗口函数的结果作为常规列烘烤到表中。我想做这样的事情: 但是我明白了 有人可以建议替代方法吗?通过Django的.raw()方法传递窗口函数语法是不合适的,因为它返回RawQuerySet,它不支持其他ORM功能,例如我需要的.filter()。 谢谢。 问题答案: 错误