问题：

为什么现代编译器不合并相邻的内存访问？

孟绪

2023-03-14

考虑以下代码：

bool AllZeroes(const char buf[4])
{
    return buf[0] == 0 &&
           buf[1] == 0 &&
           buf[2] == 0 &&
           buf[3] == 0;
}

AllZeroes(char const*):                        # @AllZeroes(char const*)
        cmp     byte ptr [rdi], 0
        je      .LBB0_2
        xor     eax, eax
        ret
.LBB0_2:
        cmp     byte ptr [rdi + 1], 0
        je      .LBB0_4
        xor     eax, eax
        ret
.LBB0_4:
        cmp     byte ptr [rdi + 2], 0
        je      .LBB0_6
        xor     eax, eax
        ret
.LBB0_6:
        cmp     byte ptr [rdi + 3], 0
        sete    al
        ret

bool AllZeroes(const char buf[4])
{
    return *(int*)buf == 0;
}

AllZeroes2(char const*):                      # @AllZeroes2(char const*)
        cmp     dword ptr [rdi], 0
        sete    al
        ret

共有1个答案

景同

2023-03-14

有短路评估的事。所以它不能像你想的那样优化。如果buf[0]==0为falsebuf[1]==0不能选中。它可以是UB或禁止使用的东西或其他东西--这一切都必须仍然有效。

https://en.wikipedia.org/wiki/short-circuit_evaluation

类似资料：

为什么编译器不合并冗余的STD：：Atomic写？

如果变量是易变的，那么显然没有任何优化是适用的。在我的情况下是什么阻止了它？下面是编译器资源管理器中的代码。
JVM为什么不缓存JIT编译代码？

问题内容： Sun的规范JVM实现对字节码进行了一些相当复杂的优化，以在代码运行几次后获得接近本机的执行速度。问题是，为什么没有将此编译后的代码缓存到磁盘以供以后使用同一功能/类时使用？就目前而言，每次执行程序时，JIT编译器都会重新启动，而不是使用代码的预编译版本。当本质上解释字节码时，是否添加此功能不会大大提高程序的初始运行时间？问题答案：我不求助于@MYYN发布的链接的’n’past
为什么现代编译器不能优化循环中的行主顺序访问？

在我的系统上，行-主顺序访问平均花费(试用），而列-主顺序访问在我的系统上花费(试用），这是相当重要的。从表面上看，这应该是一件非常简单的事情来优化。为什么现代编译器不优化这些场景？
合并SQL中的相邻行？

问题内容：我根据员工的工作时间做一些报告。在某些情况下，数据包含两个单独的记录，这实际上是一个时间段。这是该表的基本版本和一些示例记录：数据：在该示例中，最后两个记录在时间上是连续的。我想编写一个查询，该查询结合了所有相邻记录，因此结果集是这样的：理想情况下，它还应该能够处理两个以上的相邻记录，但这不是必需的。问题答案：本文为您的问题提供了许多可能的解决方案 http://www.s
为什么要编译Python代码？

问题内容：为什么要编译Python脚本？您可以直接从.py文件运行它们，并且效果很好，那么在性能上有什么优势吗？我还注意到，我的应用程序中的某些文件被编译为.pyc，而另一些则没有，为什么？问题答案：它被编译为字节码，可以更快，更快速地使用。无法编译某些文件的原因是，每次运行脚本时都会重新编译与之一起调用的主脚本。所有导入的脚本将被编译并存储在磁盘上。 Ben Blank的重要补充：
什么翻译编译器和解释器代码？

所有编程语言都被翻译成机器代码，然后由硬件解释器执行。但是什么翻译译码器的代码，例如编译器代码和解释器代码？编译器翻译源代码，但编译器也用某种语言编写，那么什么翻译编译器代码/代码呢？谢谢

为什么现代编译器不合并相邻的内存访问？

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档