问题：

L1和L2缓存的行大小

容鸿畴

2023-03-14

从本论坛上的前一个问题中，我了解到，在大多数内存系统中，一级缓存是二级缓存的子集，这意味着从二级缓存中删除的任何条目也将从一级缓存中删除。

所以现在我的问题是如何为L2缓存中的条目确定L1缓存中的相应条目。存储在L2条目中的唯一信息是标签信息。基于此标记信息，如果我重新创建addr，如果L1和L2缓存的行大小不相同，它可能会跨L1缓存中的多行。

体系结构是否真的为刷新这两条缓存线而烦恼，还是只维护具有相同缓存线大小的一级缓存和二级缓存。

我知道这是一个政策决定，但我想知道常用的技术。

共有3个答案

闾丘卓

2023-03-14

在严格包含的缓存层次结构中处理缓存块大小的最常用技术是对强制包含属性的所有缓存级别使用相同大小的缓存块。这会导致比更高级别缓存使用更大的块时更大的标记开销，这不仅使用芯片面积，而且还会增加延迟，因为更高级别缓存通常使用分阶段访问（在访问数据部分之前检查标记）。但是，它也在一定程度上简化了设计，减少了数据未使用部分造成的容量浪费。它不需要128字节缓存块中大量未使用的64字节块来补偿额外32位标记的面积损失。此外，通过相对简单的预取，可以提供利用更广泛空间局部性的更大缓存块效应，它的优点是，如果不加载附近的块（以节省内存带宽或减少冲突内存读取的延迟），则不会留下未使用的容量，并且邻接预取不需要局限于更大的对齐块。

一种不太常见的技术将缓存块划分为扇区。使扇区大小与较低级别缓存的块大小相同，可以避免过多的反向失效问题，因为较高级别缓存中的每个扇区都有自己的有效位。（为每个扇区提供所有一致性状态元数据，而不仅仅是有效性，可以避免在块中至少有一个扇区未被脏/修改以及一些一致性开销时过度使用写回带宽。）[例如，如果一个扇区处于共享状态，而另一个扇区处于独占状态，则如果使用snoopy而不是目录html" target="_blank">一致性，则对独占状态的扇区的写入可能不涉及一致性通信]。）

当标签在处理器芯片上，但数据在芯片外时，分区缓存块的面积节省尤为显著。显然，如果数据存储占用的面积与处理器芯片的大小相当（这并非不合理），那么具有64字节块的32位标记将占用处理器面积的16%（约6%），而128字节块将占用处理器面积的一半。（2009年推出的IBM POWER6可能是使用处理器芯片内标签和处理器外数据的最新处理器。像IBM那样，将数据存储在高密度嵌入式DRAM中，将标签存储在低密度SRAM中，夸大了这种效果。）

需要注意的是，Intel使用“缓存线”表示较小的单元，使用“缓存扇区”表示较大的单元。（这就是我在解释中使用“缓存块”的原因之一。）使用Intel的术语，缓存线在不同级别的缓存中大小不同是非常罕见的，无论这些级别是严格包含、严格独占还是使用其他包含策略。

（严格排除通常使用较高级别的缓存作为牺牲品缓存，其中从较低级别缓存的逐出插入到较高级别缓存中。显然，如果块大小不同且未使用分区，则逐出将要求从某个位置读取较大块的其余部分，如果在t中存在，则逐出将无效。）他创建了较低级别的缓存。[理论上，严格排除可用于不灵活的缓存绕过，其中一级逐出将绕过二级缓存并转到三级缓存，一级/二级缓存未命中将仅分配给一级缓存或二级缓存，在某些访问中绕过一级缓存。据我所知，最接近实现这一点的是安腾对浮点访问绕过一级缓存；如何实现如果我没记错的话，L2包括L1。]）

刘琨

2023-03-14

缓存线大小（通常）为64字节。

此外，请看这篇关于处理器缓存的非常有趣的文章：处理器缓存效果库

你会发现以下章节：

内存访问和性能
缓存线的影响
一级和二级缓存大小
指令级并行性
缓存关联性
错误缓存线共享
硬件复杂性

解晟睿

2023-03-14

在core i7中，L1、L2和L3中的行大小相同：即64字节。我想这简化了保持包容性和一致性。

参见第10页：https://www.aristeia.com/TalkNotes/ACCU2011_CPUCaches.pdf

L1和L2缓存的行大小

共有3个答案

相关问答

相关文章

相关阅读

相关工具

相关文档