当前位置: 首页 > 知识库问答 >
问题:

Linux中的可执行文件会影响链接动态库中的浮点精度吗?

戚京
2023-03-14

我们在动态库中遇到了浮点精度问题。

设置如下:

  • 我们有一个动态库,它在一个大的浮点数数组上执行计算X。X由许多浮点运算组成
  • 我们将这个动态库链接到两个可执行文件:A和B
  • 在库中,我们打印计算X的输入
  • 对于运行的可执行文件A和B,报告了完全相同的输入(高达DBL\u位小数)
  • 然而,计算X的输出对于可执行文件A不同于对于可执行文件B

可执行文件和库都是用C编写的,并在同一台机器上使用相同的GCC编译器版本进行编译。该库仅使用与可执行文件A相同的编译器设置编译一次,但可执行文件B的编译器设置可能不同。

由于使用同一个库,当提供相同的输入时,我们期望两个可执行文件具有相同的计算精度。库的浮点精度似乎受到外部因素的影响,例如特定于进程的配置。

这是否可能,如果是这样,如何确保我们在两次运行(程序A和B)中获得相同的精度?

编辑1

我成功地创建了一个最小的示例来演示这些差异。如果我在库中使用以下代码(例如计算X),则两次运行(A和B)的结果都不同:

float* value = new float;
*value = 2857.0f;
std::cout << std::setprecision(15) << std::log(*value) << std::endl;

我还以二进制格式打印了浮点数,它们在最后一位显示了差异。

不幸的是,无法控制可执行文件A的整个构建链。实际上,A又是一个动态库,它来自另一个我无法控制也不知道编译器选项的可执行文件。

我尝试在可执行文件B上使用许多不同的优化编译器选项,以查看是否可以获得与可执行文件a相同的结果,但直到现在,这还没有解决问题。

编辑2

上述代码的汇编器输出为:

.LFB1066:
  .cfi_startproc
  .cfi_personality 0x9b,DW.ref.__gxx_personality_v0
  push  rbp #
  .cfi_def_cfa_offset 16
  .cfi_offset 6, -16
  push  rbx #
  .cfi_def_cfa_offset 24
  .cfi_offset 3, -24
  sub rsp, 8  #,
  .cfi_def_cfa_offset 32
  mov edi, 4  #,
  call  _Znwm@PLT #
  mov DWORD PTR [rax], 0x45329000 #* D.23338,
  mov rdi, QWORD PTR _ZSt4cout@GOTPCREL[rip]  # tmp66,
  mov rax, QWORD PTR [rdi]  # cout._vptr.basic_ostream, cout._vptr.basic_ostream
  mov rax, QWORD PTR -24[rax] # tmp68,
  mov QWORD PTR 8[rax+rdi], 15  # <variable>._M_precision,
  movsd xmm0, QWORD PTR .LC1[rip] #,
  call  _ZNSo9_M_insertIdEERSoT_@PLT  #
  mov rbx, rax  # D.23465,
  mov rax, QWORD PTR [rax]  # <variable>._vptr.basic_ostream, <variable>._vptr.basic_ostream
  mov rax, QWORD PTR -24[rax] # tmp73,
  mov rbp, QWORD PTR 240[rbx+rax] # D.23552, <variable>._M_ctype
  test  rbp, rbp  # D.23552
  je  .L9 #,
  cmp BYTE PTR 56[rbp], 0 # <variable>._M_widen_ok
  je  .L5 #,
  movsx esi, BYTE PTR 67[rbp] # D.23550, <variable>._M_widen

编辑3

正如我在评论中建议的那样,我在库中打印了浮点舍入模式和SSE状态信息。

对于两次运行(可执行文件A和B),我得到相同的值:

  • 取整模式:895
  • SSE状态:8114

共有1个答案

宦高岑
2023-03-14

您的问题的答案是:是的,原则上进程可以更改代码运行的浮点上下文。

关于您的特定代码和值:

取整模式(正如Matteo所建议的)可能会影响字符串格式,因为它会反复除以10——但我无法使用std::fesetround重现这个问题。

我也看不出它会如何影响你说的不同的位模式。汇编代码显示文字0x45329000,相当于2857.0,并且文字本身不能被浮点env更改。

 类似资料:
  • 问题内容: 是否在任何地方都有Java库可以对IEEE 754半精度 数字执行计算或将其与双精度数字进行转换? 这些方法中的任何一种都是合适的: 将数字保持为半精度格式,并使用整数算术和位扭曲(如MicroFloat的单精度和双精度)进行计算 以单精度或双精度执行所有计算,转换成半精度以进行传输(在这种情况下,我需要经过良好测试的转换函数。) 编辑 :转换需要100%准确- 输入文件中 有 很多N

  • 问题内容: 是否有比浮点精度更好的数据类型? 问题答案: 小数数据类型 与基于硬件的二进制浮点数不同,十进制模块具有用户可更改的精度(默认为28位),可以与给定问题所需的精度一样大。 如果您对性能问题感到困扰,请查看GMPY

  • 在我的计算机科学课程中,我们正在研究浮点数以及它们在内存中是如何表示的。我已经理解了它们在内存中是如何表示的(尾数/有效数、指数及其偏差、符号位),我也理解了浮点是如何相互添加和减去的(反规格化和所有那些有趣的东西)。然而,在翻阅一些学习问题时,我注意到一些我无法解释的东西。 当一个不能精确表示的浮点数加到自己身上几次时,答案比我们在数学上预期的要低,但当同一个浮点数乘以一个整数时,答案就精确地得

  • 问题内容: 我用python扩展了c ++,但是exectuable不能在没有安装python的系统上运行。 当我在未安装python的Windows系统上运行时,出现以下错误: 如何将python37.dll链接到可执行文件。 问题答案: 根据定义,DLL是一个动态链接的库,它是一个单独的模块,可以在运行时进行查找和解析。 如果未安装Python,则您的应用程序将无法运行。 您需要将Python

  • 问题内容: 众所周知,即使是十进制格式的小数点后有固定数字的浮点数也无法准确表示。因此,我有以下程序要测试: 输出如下: 我无法从上述结果中回答两个问题,我正在寻求以下方面的帮助: 为什么使用的双重表示形式,并且看起来很精确,而没有。 为什么返回true? 问题答案: 我怀疑在这里不能正常工作。写入0.1时,获取确切值的一种可靠方法是write 。 “为什么0.1f + 0.2f == 0.3f返