问题：

分解浮点数

漆雕唯

2023-03-14

给定一个浮点数，我想把它分成几个部分，每个部分都有一个给定的位数。例如，给定3.1415926535并要求将其分成以10为基数的4位数部分，它将返回3.1415.926E-4 5.350E-8。实际上，我想把一个double（有52位精度）分成三部分，每个部分有18位精度，但是用一个base-10的例子来解释更容易。我不一定反对使用标准双精度IEEE浮点的内部表示的技巧，但我确实更喜欢纯粹停留在浮点领域的解决方案，以避免endian依赖或非标准浮点表示的任何问题。

不，这不是家庭作业问题，是的，这有实际用途。如果要确保浮点乘法是精确的，则需要确保所乘的任何两个数字的位数永远不会超过浮点类型中的一半。从这种分解开始，然后乘以所有部分并进行卷积，这是一种方法。是的，我也可以使用任意精度的浮点库，但是当只涉及几个部分时，这种方法可能会更快，而且肯定会更轻。

共有3个答案

谈旺

2023-03-14

匿名用户

您可以使用BitConzer。DoubleToInt64Bits和C#的按位运算符。您似乎很熟悉IEEE浮点格式，因此我将不再详细介绍。

我刚刚注意到标签C。在这种情况下，您可以使用联合并执行几乎相同的操作。

你面临的真正问题是：

处理隐式前导“1”。在边界情况下，这将导致0/-0情况。我可以预测，由于这个原因，您的代码将充满特殊情况

除了上面提到的，指数的处理应该很简单：第二和第三个18位部分减去18和36（然后找到前导的1，当然进一步减小它）。

丑陋的解决方案？IEEE754本身在边界情况下是丑陋的。Big-endian/little-endian是你最不需要的问题。

就我个人而言，我认为这对你最初的目标来说太复杂了。只要坚持一个简单的解决方案：找到一个计算尾随零的函数（标准本身定义了一个吗？我可能会与图书馆混淆）并确保总和是

希望这有帮助。

利稳

2023-03-14

分解数字的c方法是abs和frexp，它们去除了符号和指数。结果必然是[0.5,1.0]。乘以1

段干德泽

2023-03-14

如果要确保浮点乘法是精确的，则需要确保所乘的任何两个数字的位数永远不会超过浮点类型中的一半。

正是。这种技术可以在Veltkamp/Dekker乘法中找到。虽然像在其他答案中一样访问表示的位是可能的，但您也可以只使用浮点运算。这篇博文中有一个实例。您感兴趣的部分是：

Input: f; coef is 1 + 2^N
 p = f * coef;
 q = f - p;
 h = p + q;  // h contains the 53-N highest bits of f
 l = f - h;  // l contains the N lowest bits of f

*、-和必须是精确到f的IEEE 754操作才能工作。在英特尔体系结构上，这些操作由SSE2指令集提供。VisualC在其编译的C程序的前奏中将历史FPU的精度设置为53位，这也很有帮助。

分解浮点数

共有3个答案

相关问答

相关文章

相关阅读

相关工具

相关文档