从最近的checkpoint开始,replay log(详见论文design 4.3第一段),先是redo log以恢复一致性状态,之后再通过undo log将正在执行的事务回滚
日志重放发生在存储层,持续、异步、分布在所有节点中。任何读请求可能需要部分日志被重放,所以:the process of crash recovery is spread across all normal foreground processing(高可用性);
存储层的recovery关注的是存储层的一致状态 而非 用户级事务的原子性 (is focused not on user-level transactions, but on making sure that the database sees a uniform view of storage despite its distributed nature);
从实现层面讲,存储层删除所有LSN>VCL的redo日志(保证存储层一致性,见博客VCL,VDL),database层连接PG,计算出VDL,再让存储层将所有LSN>VDL的redo日志删除(保证MTR的原子性),最后仍需通过undo log回滚事务