内部机制

优质

小牛编辑

144浏览

2023-12-01

内部机制 - 清理变量(Internals - Cleaning Up Variables)

当一个值占用的位数小于32字节时，那些没有用到的位必须被清除掉。Solidity编译器设计实现为，在任何可能受到潜在的残存数据带来的副作用之前，清理掉这些脏数据。比如，在向内存写入一个值前，不需要的字节位需要被清除掉，因为没有用到的内存位可能被用来计算哈希，或作为消息调用的发送的数据存储。同样的，在向storage中存储时，未用到的字节位需要被清理掉，否则这些脏数据会带来意想不到的事情。

另一方面，如果接下来的后述操作不会产生副作用，我们不会主动清理这些字节位。比如，由于任何非0的值被JUMP指令认为是true。在它作用JUMPI指令的条件前，我们在不会清理这个布尔值。

在上述设计准则之外，Solidity编译器会在输入数据加载到栈上后清理掉它们。

不同的类型，有不同的无效值的清理规则。

类型	有效值	无效值意味着
有n的成员的枚举类型	0到（n - 1）	异常(exception)
布尔	0或1	1
有符号整数	sign-extended word	当前静默的包装了结果，以后会以异常的形式抛出来
无符号整数	高位节是0	当前静默的包装了结果，以后会以异常的形式抛出来

内部机制 - 优化(Internals - The Optimizer)

Solidity是基于汇编优化的，所以它可以，同时也被其它编程语言所使用（译者注：其它语言编译为汇编）。编译器会在JUMP和JUMPDEST处拆分基本的指令序列为一个个的基本块。在这些代码块内，所有的指令都被分析。所有的对栈，内存或存储的操作被记录成由指令及其参数组成的一个个表达式，这些表达式又会指向另一个表达式。核心目的是找到一些表达式在任何输入的情况下都恒等，然后将它们组合成一个表达式类。优化器首先尝试在一系列已知的表达式中，找出来一些全新的表达式。如果找不到，表达式通过一些简单的原则进行简化，比如 constant + constant = sum_of_constants 或 X * 1 = X。由于这一切是递归进行的，我们可以在第二项是一个更复杂的表达时，应用上述后续规则。对内存或存储的修改，存储的位置经常会被擦除，由此我们并不知道存的数据有什么不同：如果我们首先写入一个值x，再写入另一个值y，这两个都是输入变量，第二个写入时会覆盖第一个，所以我们实际在写入第二个值时，不知道第一个值是什么了。所以，如果一个简单的表达式x-y指向一个非0的常量，这样我们就能在操作y时知道x内存储的值。

在流程最后，我们知道哪一个表达式会在栈顶，并且有一系列的对内存或存储的修改。这些信息与基本的块存在一起以方便的用来连接他们。此外，关于栈，存储和内存配置的信息会传递到下一个块。如果我们知道所有JUMP和JUMPI指令的目标，我们可以构建程序的完整的控制流程图。如果有任何一个我们不知道目标的跳转（因为目标是通过输入参数进行计算的，所以原则上可能发生），我们必须擦除块知识的输入，因为他有可能是某个跳转的目的地（译者注：因为可能某个跳转在运行时会指向他，修改他的状态，所以他的推算状态是错误的）。如果某个JUMPI被发现他的条件是常量，它会被转化为一个无状态的跳转。

在最后一步，每个块中的代码都将重新生成。在某个块结束时，将生成栈上表达式的依赖树，不在这个树上的操作就被丢弃了。在我们原始代码中想要应用的对内存、存储想要的修改顺序的代码就生成出来了（被丢弃的修改被认为是完全不需要的），最终，生成了所有的需要在栈上存在的值。

这些步骤应用于每个基本的块，如果新生成的代码更小，将会替换现有的代码。如果一个块在分析期间在JUMPI处分裂，条件被证实为一个常量，JUMPI将可以基于常量值被替换掉，比如下述代码：

var x = 7;
data[7] = 9;
if (data[x] != x + 2)
  return 2;
else
  return 1;

简化的代码可以被编译为：

data[7] = 9;
return 1;

尽管上述代码在一开始有一个跳转指令。