问题：

如何计算浮点型精度，它有意义吗？

孙熠彤

2023-03-14

我在理解浮点型的精度方面有问题。msdn将该精度从6位写入到9位。但我注意到，精度取决于数字的大小：

  float smallNumber = 1.0000001f;
  Console.WriteLine(smallNumber); // 1.0000001

  bigNumber = 100000001f;
  Console.WriteLine(bigNumber); // 100000000

小数比大数更精确，我理解IEEE754，但我不明白MSDN是如何计算精度的，它有意义吗？

此外，您还可以在这里使用浮点格式的数字表示。请在“您输入的”输入中写入100000000值，然后单击右侧的“1”。然后将输入值更改为1，然后再次单击“1”。你可以看到精度上的差异。

共有3个答案

仲孙德惠

2023-03-14

我想他们在留档中的意思是，根据数字的精确度从小数点后6位到9位不等。按照你链接的页面上解释的标准，有时微软在留档方面有点懒，就像我们其他人一样。浮点数的问题是它不准确。如果你把1.05这个数字放在链接中的网站上，你会注意到它不能准确地存储在浮点数中。它实际上是作为1.0499999523162841796875存储的。这样存储可以更快地进行计算。这对金钱来说不是很好，例如，如果你的商品定价为1.05美元，而你卖出了10亿美元，那该怎么办？

程凯定

2023-03-14

是的，舍入误差前的位数是精度的衡量标准，但不能仅从两个数字来评估精度，因为您可能离舍入阈值更近或更远。

为了更好地理解这种情况，您需要了解浮动是如何表示的。

IEEE754 32位浮点数存储为：

bool(1bit sign) * integer(24bit mantisa) << integer(8bit exponent)

是的，尾数是24位而不是23位，因为它的MSB隐式设置为1。

正如你所看到的，只有整数和位移位。所以如果你代表的是2^24以下的自然数，你就没有完全舍入。对于更大的数字，二进制零填充从右边出现，导致了差异。

如果是小数点后的数字，则从左侧开始填充零。但另一个问题是，在二进制中，你不能准确地存储一些十进制数。例如：

0.3 dec = 0.100110011001100110011001100110011001100... bin
0.25 dec = 0.01 bin

正如你所看到的那样，二进制中的0.3 dec序列是无限的（就像我们不能用decadic写1/3），因此，如果只将其裁剪为24位，则会丢失其余的部分，并且数字不再是你想要的。

如果将0.3和0.125进行比较，0.125是精确的，0.3不是，但0.125比0.3小得多。所以你的度量是不正确的，除非你探索了更接近的值，这些值将涵盖舍入步骤，并计算出这些集合的最大差异。例如，你可以比较

记住fabs（x-round（x））的最大差异，然后对

然后比较这两个差异。

除此之外，你还错过了一件非常重要的事情。这就是从文本转换成二进制和二进制时的错误，通常更大。首先，试着在不舍入的情况下打印数字（例如，强制在小数点后打印20位小数）。

此外，数字存储在二进制中，所以为了打印它们，你需要将其转换为十进制，包括乘法和除法10。数字中缺少的位越多（零位），打印错误就越大。为了尽可能精确，我们使用了一个技巧，即用十六进制打印数字（无舍入错误），然后根据整数数学将十六进制字符串本身转换为十进制。这比单纯的浮点打印准确得多。有关更多信息，请参阅相关QA：

打印舍入误差最小的32位浮点的最佳尝试（仅限整数数学）
库/编程语言如何将浮点数转换为字符串
如何将很长的二进制数转换为十进制数

现在回到浮点数表示的“精确”位数。对于数字的整数部分就这么简单：

dec_digits = floor(log10(2^24)) = floor(7.22) = 7

然而，对于小数点后的数字来说，这并不像许多四舍五入那样精确（对于前几个十位数字）。有关更多信息，请参阅：

如何打印浮点数的精确值

杜元明

2023-03-14

MSDN留档是荒谬和错误的。

糟糕的概念。二进制浮点格式在十进制数字中没有任何精度，因为它根本没有十进制数字。它表示带符号的数字、固定数量的二进制数字（位）和2的幂的指数。

高端的错误。浮点格式精确地表示许多数字，精度无限。例如，“3”是精确表示的。你可以写任意远的小数，3.0000000000…，所有的小数位数都是正确的。另一个例子是1.40129846432481709237295832899161312802619418765157717570682838897991082685860601486638188362158203125•10⁻⁴⁵。这个数字在十进制中有105个有效数字，但float格式正好代表它（它是2⁻¹⁴⁹）。

低端错误。当“999999.97”从十进制转换为浮点数时，结果是1,000,000。所以甚至没有一个十进制数字是正确的。

不是精确度的度量。因为浮点数意义有24位，所以其最低位的分辨率比最高位的分辨率高2²³倍。这大约是6.9位，因为log₁₀2²³大约是6.9位。但这只是告诉我们表示的分辨率——粗略度。当我们将一个数字转换为浮点数格式时，我们得到的结果与该分辨率的数字最多相差1/2，因为我们四舍五入到最接近的可表示值。因此，转换为浮点数的相对误差最多为2²⁴中的1部分，在上述意义上相当于大约7.2位数。如果我们使用数字来测量分辨率，那么我们说分辨率大约是7.2位数，而不是6-9位数。

这些数字来自哪里？

所以，如果“~6-9位”不是一个正确的概念，不是来自数字的实际界限，也不是测量精度，那么它来自哪里？我们不能确定，但是6和9确实出现在float格式的两个描述中。

6是保证的最大数字x：

如果任何最多有x个有效位的十进制数字在float格式的正常指数范围内，并被转换为该格式中表示的最接近的值，那么，当结果被转换为最多有x个有效位的最接近的十进制数字时，转换的结果等于原始数字

因此，可以合理地说浮点数至少可以保留六个十进制数字。然而，正如我们将看到的，没有涉及九个数字的约束。

9是保证这一点的最小数字x：

如果任何有限的浮点数被转换为具有x个数字的最接近的十进制数，那么，当结果被转换为浮点数中表示的最接近的值时，转换的结果等于原始数。

作为类比，如果float是一个容器，那么保证容纳它的最大“十进制容器”是六位数字，保证容纳它的最小“十进制容器”是九位数字。6和9类似于浮子容器的内部和外部测量。

假设你有一块7.2个单元长的积木，你正在看它在每1个单元长的砖块上的位置。如果你把积木的开始放在一块砖块的开始，它会延伸出7.2块砖块。然而，其他人选择它的开始，他们可能会从一块砖块的中间开始。然后它会覆盖那块砖块的一部分，接下来的6块，以及最后一块砖块的一部分（例如。5 6 .7 = 7.2)。所以一个7.2个单元的积木只能保证覆盖6块砖块。相反，如果你选择它们的位置，8块砖块可以覆盖7.2个单元的积木。但是如果其他人选择从哪里开始，第一个可能只覆盖0.1个单位的块。然后你需要7个更多的部分，所以需要9块砖块。

这个类比成立的原因是2的幂和10的幂相对于彼此的间隔是不规则的。2¹⁰（1024）靠近10³（1000）。10是在1024（包括在内）到2048（不包括在内）之间的数字的浮点数格式中使用的指数。所以1024到2048之间的间隔就像是在100-1000结束和1000-10,000块开始之后放置的块。

但请注意，这个包含9位数字的属性是外部度量，它不是float可以执行的功能，也不是它可以提供的服务。它是float需要的东西（如果要以十进制格式保存），而不是它提供的东西。因此，它不是一个浮点数可以存储多少位数的界限。

进一步阅读

为了更好地理解浮点运算，考虑Jean Michel Muller等人研究IEEE-74浮点运算标准或类似浮点算术手册之类的好教材。

类似资料：

浮点精度golang

谢谢
计算浮点型表示法的精度极限顺序[重复]

假设我的机器中有一个单精度浮点格式变量，我想给它分配给定操作的结果。来自维基百科： IEEE 754标准指定二进制32具有：符号位：1位我不清楚最后一个要求（e-6的精度）是如何得出的。一般来说，给定一个数据类型如上面的或，如何在基数10中找到精度限制？
Golang浮点精度浮点32 vs浮点64

我编写了一个程序来演示Go中的浮点错误：它打印：这与用C编写的相同程序的行为相匹配（使用双代码类型）但是，如果改用，程序就会陷入无限循环！如果将C程序修改为使用而不是，它将打印为什么在使用时，Go程序的输出与C程序的输出不一样？
PHP-浮点数精度

问题内容： $a = ‘35’; $b = ‘-34.99’; echo ($a + $b); 结果为0.009999999999998 这是怎么回事？我想知道为什么我的程序不断报告奇怪的结果。为什么PHP不返回预期的0.01？问题答案：因为浮点运算！=实数运算。对于一些浮子和，由不精确性引起的差异的说明是。这适用于使用浮点数的任何语言。由于浮点数是具有有限精度的二进制数，因此存在有限数量
Fortran 浮点数精度

本文向大家介绍Fortran 浮点数精度，包括了Fortran 浮点数精度的使用技巧和注意事项，需要的朋友参考一下示例类型的浮点数real不能有任何实数值。它们可以表示实数，最多可以包含一定数量的十进制数字。 FORTRAN 77保证了两种浮点类型，而最新的标准则至少保证了两种实数类型。实变量可以声明为 x这是默认类型的实数，并且y是比更大的十进制精度的实数x。在Fortran 2008中，十
设置精度和浮点

运行以下代码时，我希望收到这样的输出：但结果如下：欢迎任何能指导我正确使用浮点比较和正确使用setprecision的建议。

如何计算浮点型精度，它有意义吗？

共有3个答案

相关问答

相关文章

相关阅读

相关工具

相关文档