问题：

关于 i7 的分支预测

薛高澹

2023-03-14

我想知道英特尔 i7 处理器的分支预测是如何工作的？

目前，我知道称为“动态分支预测”的预测器。

对于1位预测器：硬件总是预测分支指令的方向与上次执行时的方向相同。

在实践中效果更好的改进版本是2位预测器。为了进一步提高预测精度，引入了2位预测方案。在这些方案中，预测必须错误两次才能改变。

i7有和上面一样的预测器吗

共有2个答案

韶亮

2023-03-14

简短的回答是否定的。

我相当肯定没有英特尔CPU使用过你描述的一位预测器。

最初的奔腾处理器使用了两位描述符，就像你描述的那样。它使用的四个值通常被描述为“强烈不采用”、“微弱不采用”、“微弱采用”和“强烈采用”。每当一个分支被采用，计数器就向“强采用”移动一位。每当一个分支未被采用，它就向“强烈未被采用”移动一点。它是一个饱和计数器，所以如果(例如)在计数器已经处于“强执行”时执行分支，计数器就不会改变。[我应该补充一下:这是英特尔如何记录它的，显然是打算让它工作——如果没记错的话，Agner Fog和Terje Mathiesen发现它的工作方式确实有点不同——而且通常没有这个好。

从奔腾/MMX和奔腾专业版开始，他们设计了一个更复杂的两级分支预测器。它增加了一个4位分支历史，用于选择16个2位计数器中的一个。这意味着如果你有一个模式（例如）采取，采取，不采取，采取，（然后重复），它会迅速调整到这一点，并正确预测所有分支。

我不确定i7中分支预测的细节，但我认为可以肯定的是，它至少与奔腾Pro一样复杂，而不是原始奔腾的回归。

干善

2023-03-14

我们对分支预测器的大部分了解来自测试。英特尔没有公布太多细节。错误预测惩罚大约是18个时钟周期，因此准确的分支预测很重要。

英特尔使用两级分支预测器。内部级别被认为与酷睿2 CPU相同。

外层更复杂，甚至可以正确预测固定计数高达64的循环。使用了两个18位全局历史缓冲区。一个包含至少进行过一次的所有跳转。另一个包含最重要的跳转。（这些缓冲区中的条目数量未知。）

注意，间接跳转和调用有自己的预测器。

关于 i7 的分支预测

共有2个答案

相关问答

相关文章

相关阅读

相关工具

相关文档