我们在动态库中遇到了浮点精度问题。
设置如下:
可执行文件和库都是用C编写的,并在同一台机器上使用相同的GCC编译器版本进行编译。该库仅使用与可执行文件A相同的编译器设置编译一次,但可执行文件B的编译器设置可能不同。
由于使用同一个库,当提供相同的输入时,我们期望两个可执行文件具有相同的计算精度。库的浮点精度似乎受到外部因素的影响,例如特定于进程的配置。
这是否可能,如果是这样,如何确保我们在两次运行(程序A和B)中获得相同的精度?
编辑1
我成功地创建了一个最小的示例来演示这些差异。如果我在库中使用以下代码(例如计算X),则两次运行(A和B)的结果都不同:
float* value = new float;
*value = 2857.0f;
std::cout << std::setprecision(15) << std::log(*value) << std::endl;
我还以二进制格式打印了浮点数,它们在最后一位显示了差异。
不幸的是,无法控制可执行文件A的整个构建链。实际上,A又是一个动态库,它来自另一个我无法控制也不知道编译器选项的可执行文件。
我尝试在可执行文件B上使用许多不同的优化编译器选项,以查看是否可以获得与可执行文件a相同的结果,但直到现在,这还没有解决问题。
编辑2
上述代码的汇编器输出为:
.LFB1066:
.cfi_startproc
.cfi_personality 0x9b,DW.ref.__gxx_personality_v0
push rbp #
.cfi_def_cfa_offset 16
.cfi_offset 6, -16
push rbx #
.cfi_def_cfa_offset 24
.cfi_offset 3, -24
sub rsp, 8 #,
.cfi_def_cfa_offset 32
mov edi, 4 #,
call _Znwm@PLT #
mov DWORD PTR [rax], 0x45329000 #* D.23338,
mov rdi, QWORD PTR _ZSt4cout@GOTPCREL[rip] # tmp66,
mov rax, QWORD PTR [rdi] # cout._vptr.basic_ostream, cout._vptr.basic_ostream
mov rax, QWORD PTR -24[rax] # tmp68,
mov QWORD PTR 8[rax+rdi], 15 # <variable>._M_precision,
movsd xmm0, QWORD PTR .LC1[rip] #,
call _ZNSo9_M_insertIdEERSoT_@PLT #
mov rbx, rax # D.23465,
mov rax, QWORD PTR [rax] # <variable>._vptr.basic_ostream, <variable>._vptr.basic_ostream
mov rax, QWORD PTR -24[rax] # tmp73,
mov rbp, QWORD PTR 240[rbx+rax] # D.23552, <variable>._M_ctype
test rbp, rbp # D.23552
je .L9 #,
cmp BYTE PTR 56[rbp], 0 # <variable>._M_widen_ok
je .L5 #,
movsx esi, BYTE PTR 67[rbp] # D.23550, <variable>._M_widen
编辑3
正如我在评论中建议的那样,我在库中打印了浮点舍入模式和SSE状态信息。
对于两次运行(可执行文件A和B),我得到相同的值:
您的问题的答案是:是的,原则上进程可以更改代码运行的浮点上下文。
关于您的特定代码和值:
取整模式(正如Matteo所建议的)可能会影响字符串格式,因为它会反复除以10——但我无法使用std::fesetround
重现这个问题。
我也看不出它会如何影响你说的不同的位模式。汇编代码显示文字0x45329000,相当于2857.0,并且文字本身不能被浮点env更改。
问题内容: 是否在任何地方都有Java库可以对IEEE 754半精度 数字执行计算或将其与双精度数字进行转换? 这些方法中的任何一种都是合适的: 将数字保持为半精度格式,并使用整数算术和位扭曲(如MicroFloat的单精度和双精度)进行计算 以单精度或双精度执行所有计算,转换成半精度以进行传输(在这种情况下,我需要经过良好测试的转换函数。) 编辑 :转换需要100%准确- 输入文件中 有 很多N
问题内容: 是否有比浮点精度更好的数据类型? 问题答案: 小数数据类型 与基于硬件的二进制浮点数不同,十进制模块具有用户可更改的精度(默认为28位),可以与给定问题所需的精度一样大。 如果您对性能问题感到困扰,请查看GMPY
在我的计算机科学课程中,我们正在研究浮点数以及它们在内存中是如何表示的。我已经理解了它们在内存中是如何表示的(尾数/有效数、指数及其偏差、符号位),我也理解了浮点是如何相互添加和减去的(反规格化和所有那些有趣的东西)。然而,在翻阅一些学习问题时,我注意到一些我无法解释的东西。 当一个不能精确表示的浮点数加到自己身上几次时,答案比我们在数学上预期的要低,但当同一个浮点数乘以一个整数时,答案就精确地得
谢谢
问题内容: 我用python扩展了c ++,但是exectuable不能在没有安装python的系统上运行。 当我在未安装python的Windows系统上运行时,出现以下错误: 如何将python37.dll链接到可执行文件。 问题答案: 根据定义,DLL是一个动态链接的库,它是一个单独的模块,可以在运行时进行查找和解析。 如果未安装Python,则您的应用程序将无法运行。 您需要将Python
问题内容: 众所周知,即使是十进制格式的小数点后有固定数字的浮点数也无法准确表示。因此,我有以下程序要测试: 输出如下: 我无法从上述结果中回答两个问题,我正在寻求以下方面的帮助: 为什么使用的双重表示形式,并且看起来很精确,而没有。 为什么返回true? 问题答案: 我怀疑在这里不能正常工作。写入0.1时,获取确切值的一种可靠方法是write 。 “为什么0.1f + 0.2f == 0.3f返