问题：

Linux中的可执行文件会影响链接动态库中的浮点精度吗？

戚京

2023-03-14

我们在动态库中遇到了浮点精度问题。

设置如下：

我们有一个动态库，它在一个大的浮点数数组上执行计算X。X由许多浮点运算组成
我们将这个动态库链接到两个可执行文件：A和B
在库中，我们打印计算X的输入
对于运行的可执行文件A和B，报告了完全相同的输入（高达DBL\u位小数）
然而，计算X的输出对于可执行文件A不同于对于可执行文件B

可执行文件和库都是用C编写的，并在同一台机器上使用相同的GCC编译器版本进行编译。该库仅使用与可执行文件A相同的编译器设置编译一次，但可执行文件B的编译器设置可能不同。

由于使用同一个库，当提供相同的输入时，我们期望两个可执行文件具有相同的计算精度。库的浮点精度似乎受到外部因素的影响，例如特定于进程的配置。

这是否可能，如果是这样，如何确保我们在两次运行（程序A和B）中获得相同的精度？

编辑1

我成功地创建了一个最小的示例来演示这些差异。如果我在库中使用以下代码（例如计算X），则两次运行（A和B）的结果都不同：

float* value = new float;
*value = 2857.0f;
std::cout << std::setprecision(15) << std::log(*value) << std::endl;

我还以二进制格式打印了浮点数，它们在最后一位显示了差异。

不幸的是，无法控制可执行文件A的整个构建链。实际上，A又是一个动态库，它来自另一个我无法控制也不知道编译器选项的可执行文件。

我尝试在可执行文件B上使用许多不同的优化编译器选项，以查看是否可以获得与可执行文件a相同的结果，但直到现在，这还没有解决问题。

编辑2

上述代码的汇编器输出为：

.LFB1066:
  .cfi_startproc
  .cfi_personality 0x9b,DW.ref.__gxx_personality_v0
  push  rbp #
  .cfi_def_cfa_offset 16
  .cfi_offset 6, -16
  push  rbx #
  .cfi_def_cfa_offset 24
  .cfi_offset 3, -24
  sub rsp, 8  #,
  .cfi_def_cfa_offset 32
  mov edi, 4  #,
  call  _Znwm@PLT #
  mov DWORD PTR [rax], 0x45329000 #* D.23338,
  mov rdi, QWORD PTR _ZSt4cout@GOTPCREL[rip]  # tmp66,
  mov rax, QWORD PTR [rdi]  # cout._vptr.basic_ostream, cout._vptr.basic_ostream
  mov rax, QWORD PTR -24[rax] # tmp68,
  mov QWORD PTR 8[rax+rdi], 15  # <variable>._M_precision,
  movsd xmm0, QWORD PTR .LC1[rip] #,
  call  _ZNSo9_M_insertIdEERSoT_@PLT  #
  mov rbx, rax  # D.23465,
  mov rax, QWORD PTR [rax]  # <variable>._vptr.basic_ostream, <variable>._vptr.basic_ostream
  mov rax, QWORD PTR -24[rax] # tmp73,
  mov rbp, QWORD PTR 240[rbx+rax] # D.23552, <variable>._M_ctype
  test  rbp, rbp  # D.23552
  je  .L9 #,
  cmp BYTE PTR 56[rbp], 0 # <variable>._M_widen_ok
  je  .L5 #,
  movsx esi, BYTE PTR 67[rbp] # D.23550, <variable>._M_widen

编辑3

正如我在评论中建议的那样，我在库中打印了浮点舍入模式和SSE状态信息。

对于两次运行（可执行文件A和B），我得到相同的值：

取整模式：895
SSE状态：8114

共有1个答案

宦高岑

2023-03-14

您的问题的答案是：是的，原则上进程可以更改代码运行的浮点上下文。

关于您的特定代码和值：

取整模式（正如Matteo所建议的）可能会影响字符串格式，因为它会反复除以10——但我无法使用std:：fesetround重现这个问题。

我也看不出它会如何影响你说的不同的位模式。汇编代码显示文字0x45329000，相当于2857.0，并且文字本身不能被浮点env更改。

类似资料：

Java中的半精度浮点

问题内容：是否在任何地方都有Java库可以对IEEE 754半精度数字执行计算或将其与双精度数字进行转换？这些方法中的任何一种都是合适的：将数字保持为半精度格式，并使用整数算术和位扭曲（如MicroFloat的单精度和双精度）进行计算以单精度或双精度执行所有计算，转换成半精度以进行传输（在这种情况下，我需要经过良好测试的转换函数。）编辑：转换需要100％准确- 输入文件中有很多N
Python中的双精度浮点值？

问题内容：是否有比浮点精度更好的数据类型？问题答案：小数数据类型与基于硬件的二进制浮点数不同，十进制模块具有用户可更改的精度（默认为28位），可以与给定问题所需的精度一样大。如果您对性能问题感到困扰，请查看GMPY
添加浮点的精度与将浮点乘以整数的精度

在我的计算机科学课程中，我们正在研究浮点数以及它们在内存中是如何表示的。我已经理解了它们在内存中是如何表示的（尾数/有效数、指数及其偏差、符号位），我也理解了浮点是如何相互添加和减去的（反规格化和所有那些有趣的东西）。然而，在翻阅一些学习问题时，我注意到一些我无法解释的东西。当一个不能精确表示的浮点数加到自己身上几次时，答案比我们在数学上预期的要低，但当同一个浮点数乘以一个整数时，答案就精确地得
浮点精度golang

谢谢
python37.dll未在可执行文件中链接

问题内容：我用python扩展了c ++，但是exectuable不能在没有安装python的系统上运行。当我在未安装python的Windows系统上运行时，出现以下错误：如何将python37.dll链接到可执行文件。问题答案：根据定义，DLL是一个动态链接的库，它是一个单独的模块，可以在运行时进行查找和解析。如果未安装Python，则您的应用程序将无法运行。您需要将Python
Java中的浮点精度和相等性

问题内容：众所周知，即使是十进制格式的小数点后有固定数字的浮点数也无法准确表示。因此，我有以下程序要测试：输出如下：我无法从上述结果中回答两个问题，我正在寻求以下方面的帮助：为什么使用的双重表示形式，并且看起来很精确，而没有。为什么返回true？问题答案：我怀疑在这里不能正常工作。写入0.1时，获取确切值的一种可靠方法是write 。 “为什么0.1f + 0.2f == 0.3f返

Linux中的可执行文件会影响链接动态库中的浮点精度吗？

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档