例如,你有一个带有气泡排序实现的函数sort(int*数字,size_t计数),
C编译器识别这种模式。是否允许编译器将其更改为另一个示例?比如快速排序。
另一个例子是将从0到n
的所有数字相加,编译器可以用(n*(n-1))/2
替换for循环。
这里的“算法”这个词可能有点强,但是是的,现代编译器的默认设置通常提供与当前编译器技术允许的尽可能多的自由来更改代码,但与此同时,几乎每个编写的现代编译器都为应用程序程序员提供了一些关于编译器可以做什么和不能做什么的控制。
给定默认设置,现代编译器可以使用简单算法的替换构造,在某种程度上,甚至可以根据程序员可设置的偏好指导他们如何选择替换构造。编译器提供了许多不同的优化选项和级别,最常见的是与速度和/或内存使用有关。但更改的范围仅限于更简单的构造,根据构造的不同,这些构造可以变得更高效,也可以完全忽略。
在您的特定示例中,对于带有排序算法的函数,算法本身不会被替换,但是其中的一些组成部分可以根据它们的编码方式进行优化。
相反,您还可以将当前编译器设置为保留您编写的代码。例如,在较新版本的GCC(从v4.4开始)中,您可以使用这些Pragma
环境完全禁用优化:
#pragma GCC push_options
#pragma GCC optimize ("O0")
normal C code
#pragma GCC pop_options
编译器定期对优化者认可的更简单的模式执行此操作。
在您的特定情况下,算法的改变可能会产生适得其反的副作用,因为气泡排序比快速排序对大多数排序的数组更有效。
还要注意,优化必须保持相同的语义:用不稳定的排序算法(如快速排序)替换稳定的排序算法,只有在可以断言不需要稳定性的情况下才是可接受的。对一个简单的< code>int数组进行排序似乎不受这个问题的影响,但是在具有负零和填充位的体系结构上,它会有所不同。如果数组是浮点型的,排序算法的稳定性肯定会影响最终的顺序。
如果被调用的函数在优化域内,即使函数是另一个文件,也有办法做到这一点,那么是的。与在同一文件中具有调用函数的方式相同。但这并不意味着编译器根据函数的名称假设被调用的代码到底是什么,你可以轻松地创建自己的 C 库并将其链接进来,并让命名函数(例如 qsort)做任何你想做的事情。所以这是不可取的,但工具做到了:
#include <stdio.h>
void fun ( void )
{
printf("0");
}
Disassembly of section .text:
00000000 <fun>:
0: e3a00030 mov r0, #48 ; 0x30
4: eafffffe b 0 <putchar>
编译器已将所需的函数调用替换为其他函数调用。
所以是的,如果优化器被编程为可以并且将会这样做。如果它具有可见性,它更有可能将两个部分作为一个整体进行优化:
unsigned int more_fun ( unsigned int a, unsigned int b )
{
return(a+b);
}
unsigned int fun ( void )
{
return(more_fun(1,2));
}
Disassembly of section .text:
00000000 <more_fun>:
0: e0800001 add r0, r0, r1
4: e12fff1e bx lr
00000008 <fun>:
8: e3a00003 mov r0, #3
c: e12fff1e bx lr
这不是像printf示例那样用另一个函数替换一个函数,而是用可能更优化的内联解决方案替换优化的函数。
当然,有些编译器会优化死循环:
unsigned int fun ( void )
{
unsigned int ra;
for(ra=0;ra<10;ra++)
{
}
return(ra);
}
00000000 <fun>:
0: e3a0000a mov r0, #10
4: e12fff1e bx lr
当然这是一个微不足道的问题,但我已经生成了伪随机数发生器,它们是像这样的死代码,取决于编译器/优化器和代码,如果它已经被编程,它会将循环/代码简化为更简单的东西。
或者也许这就是你要问的:
unsigned int more_fun ( unsigned int n )
{
return((n*(n-1))/2);
}
unsigned int fun ( void )
{
return(more_fun(10));
}
00000000 <more_fun>:
0: e2403001 sub r3, r0, #1
4: e0020093 mul r2, r3, r0
8: e1a000a2 lsr r0, r2, #1
c: e12fff1e bx lr
00000010 <fun>:
10: e3a0002d mov r0, #45 ; 0x2d
14: e12fff1e bx lr
数学在可能的情况下被删除。
您不能假设特定的编译器会这样做,也不能期望两个编译器产生相同的代码/优化。但是,如果编译器被编程为并且能够看到它需要优化的所有代码,那么它可以并且将能够做到这一点。
就“允许的”而言,编译器的工作是用另一种语言从功能上替换一种语言,这也是为什么任何两个从一种语言转换为另一种(同一输入语言转换为同一输出目标)的编译器都可以并且将产生不同的输出代码的部分原因,这是一种功能上的替换——一个编译器的输出没有一个正确的答案,它可能会有所不同。因此,在可能的情况下,如上文所示,编译器根据语言生成功能等效的代码,这是它的工作,因此它可以完成这项工作。虽然我不认为putchar是printf的替代品,因为编译器没有查看我的printf代码,但同时我假设这个编译器(gcc)有一个命令行选项不允许这样做。同样,编译器替换同一类型的两个结构,比如一个结构赋值,这并不少见;使用memcpy,但同时有一个命令行选项,指示我不想让你用memcpy来替换我要求的代码,我希望它是独立完成的。
在 gcc 和 clang 之间,你会看到这些行为,所以就“允许”这个词而言,我想它是允许的。如图所示,您可以检查编译器输出,并查看您的用例,编译器做了什么。
页替换算法 操作系统为何要进行页面置换呢?这是由于操作系统给用户态的应用程序提供了一个虚拟的“大容量”内存空间,而实际的物理内存空间又没有那么大。所以操作系统就就“瞒着”应用程序,只把应用程序中“常用”的数据和代码放在物理内存中,而不常用的数据和代码放在了硬盘这样的存储介质上。如果应用程序访问的是“常用”的数据和代码,那么操作系统已经放置在内存中了,不会出现什么问题。但当应用程序访问它认为应该在内
我有一个理论(非确定性,难以测试,从未发生在实践中)硬件问题报告硬件供应商,其中双字写入特定内存范围可能破坏任何未来的总线传输。 虽然我在C代码中没有任何明确的双词写入,但我担心编译器(在当前或未来的实现中)被允许将多个相邻的词赋值合并为单个双词赋值。 编译器不允许对Volatile的赋值进行重新排序,但(对我来说)不清楚合并是否算作重新排序。我的直觉是这样的,但我以前被语言律师纠正过! 示例:
IE 可能会失败。 C11附件J.2内容如下
主要内容:页面替换算法的类型页面替换算法决定哪个内存页面将被替换。 替换过程有时称为换出或写入磁盘。在主存储器中找不到请求的页面时(页面错误),完成页面替换。 虚拟内存有两个主要方面,即帧分配和页面替换。 拥有最佳的帧分配和页面替换算法是非常重要的。 帧分配全部是关于将多少帧分配给进程,而页面替换则是确定需要替换的页码,以便为请求的页面留出空间。 如果算法不是最优的? 如果分配给进程的帧数量不够或不准确,则可能会出现抖动问题
请考虑以下简单代码: https://godbolt.org/z/i2kby7 您可以看到和都没有优化对的潜在调用。在我的理解中,这是正确的:抽象机器假设变量随时可能发生变化(例如,由于是硬件映射的),因此将初始化常数折叠为检查将是错误的。 > 这里讨论了消除对的读写操作:允许编译器优化本地volatile变量吗?(谢谢内森!)。我认为标准是非常清楚的,那些读写必须发生。但是这些讨论并不包括编译器
有问题的代码如下: 编译器会优化它吗?根据C-Standard(如果我理解正确的话),第二个操作数必须提升为;因此乘法必须使用FPU(或fp仿真)完成。 从理论上讲,该操作可以在正常的硬件寄存器中完成,只需添加一个即时的(并且可能是溢出检查)。是否允许编译器执行此优化?是否有已知的编译器这样做?如果是这样,他们是否也会识别该表达式 这是避免有关隐式转换的静态代码检查器警告所必需的? 补充一下:我知