在工作中,我们会碰到一种这样场景:
表A为订单信息表、B为订单操作日志表,假设业务系统产生BUG,导致A表的订单数据有一部分更新失败。
需求:我们需要批量修复表A中的订单信息。
业务开发的常规做法是通过脚本循环去修复数据。
但是对于一个数据开发人员,我们肯定可以通过SQL的方式来修复数据。
UPDATE A
[INNER JOIN | LEFT JOIN] B ON A.id=B.relation_id
SET A.column=B.column
WHERE condition;
这条SQL的大体意思就是通过A表关联B表,然后根据B表中的字段,修复A表中对应的数据。
然后我们再回过头来看下需求,我们只需要根据B表修复A表数据即可。其SQL如下:
UPDATE A
JOIN B ON A.id=B.order_id
SET A.order_status=B.target_status AND A.address=B.target_address
WHERE A.created_at>='2022-03-17 08:00:00' AND A.created_at<'2022-03-17 10:00:00';
注意:在SQL写完的时候,要先在最后加上LIMIT或者WHRER id=?的条件限制一下数据条数,并验证结果,不要上去就直接执行SQL了,这样很容易问题。
整个修复过程,从接到需求到SQL编写,到最后修复数据只花了几分钟的时间,对于我来说这要比写脚本快多了。