让这世界再多一份 GNU m4 教程 (4)

谭仰岳

2023-12-01

上一篇：http://segmentfault.com/a/1190000004128102

递归

现在再强调一次，m4 会将当前宏的展开结果插入到待读取的输入流的前端。也就是说，m4 会对当前宏的展开结果再次进行扫描，以处理嵌套的宏调用。这个性质决定了可以写出让 m4 累死的递归宏。

例如：

define(`TEST', `TEST')
TEST

当 m4 试图对 TEST 进行展开时，它就会永无休止的去展开 TEST，而每次展开的结果依然是 TEST。

既然有递归，那么就可以利用递归来做一些计算，为了让递归能够结束，这就需要 m4 能够支持条件。幸好，我们已经知道 m4 是支持条件的。下面，是一个递归版本的 Fibonacci 宏的实现与应用，它可以产生第 47 个 Fibonacci 数：

divert(-1)
define(`FIB',
`ifelse(`$1', `0',
         0,
        `ifelse(`$1', `1',
                 1,
                `eval(FIB(eval($1 - 1)) + FIB(eval($1-2)))')')')
divert(0)dnl
FIB(46)

m4 的展开结果应该是 1836311903。也许你要等很久才会看到这个结果。因为递归的 Fibonacci 数计算过程中包含着大量的重复计算，效率很低。

不过，迭代版本的 Fibonacci 数计算过程也能写得出来：

divert(-1)
define(`FIB_ITER',
`ifelse(`$3', 0,
         $2,
     `FIB_ITER(eval($1 + $2), $1, eval($3 - 1))')')
define(`FIB', `FIB_ITER(1, 0, $1)')
divert(0)dnl
FIB(46)

迭代计算很快，在我的机器上只需要 0.002 秒就可以得出 1836311903 这个结果。不过，如果想尝试比 46 更大的数，比如 FIB(47)，结果就会出现负数。这是因为 m4 目前只支持 32 位的有符号整数，它能表示的最大正整数是 2^31 - 1，而 FIB(47) 的结果会大于这个数。

循环

既然有递归，那么就可以用它来模拟循环。例如：

define(`for',
`ifelse($#,
        0,
        ``$0'',
        `ifelse(eval($2 <= $3),
                1,
               `pushdef(`$1',$2)$4`'popdef(`$1')$0(`$1', incr($2), $3, `$4')')')')

这个 for 宏可以像下面这样调用：

for(`i', 1, n, `循环内的计算')

它类似于 C 语言中的 for 循环：

for(int i = 1; i <= n; i++) {
        循环内的计算
}

例如，可以用 for 宏将 64 个 - 符号发送到输出流：

for(`i', 1, 64, `-')

这个宏的展开结果为：

----------------------------------------------------------------

如果你用过 reStructuredText 标记语言，一定会知道怎么用 for 宏构建一个协助你构造一个用于快速撰写 reStructuredText 标题标记的宏。

要理解 for 宏的定义，有几个 m4 小知识需要补习一下。请向下看。

宏参数列表的特征值

我们已经知道 $1, $2, ..., $9 对应于宏参数列表中的各个参数（GNU m4 不限定参数的个数，其他 m4 实现最多支持 9 个参数）。如果对 C 或 Bash 有所了解，那么当我说 $0 是宏本身，估计不会觉得很奇怪。因此，在上一节 for 宏定义中，$0 表示引用了宏名 for。不妨将 $0 改成 for 试一下。

$# 表示宏参数的个数。例如：

define(`count', ``$0': $# args')
count        # -> count: 0 args
count()      # -> count: 1 args
count(1)     # -> count: 1 args
count(1,)    # -> count: 2 args

# 是注释符，-> 后面的文本是 m4 对注释符号之前的文本处理后发送到输出流的结果。

值得注意的是，即使 () 内什么也没有，m4 也会认为 count 宏是有一个参数的，它是空字串。

for 的定义中，第一处条件语句为：

ifelse($#,
        0,
        ``$0'',
        ... ...)

它的作用就是告诉 m4，遇到 for 的调用语句，如果 for 的参数个数为 0，那么 for 的展开结果为带引号的字符串：

`for'

要理解为什么在条件语句中，for 用两重引号包围起来，你需要再认真的复习一次 m4 的宏展开过程。如果用单重引号，那么以无参数的形式调用 for 宏时，m4 会陷入对 for 宏无限次的展开过程中。

宏的作用域

所有的宏都是全局的。

如果我们需要『局部宏』该怎么做？也就是说，如何将一个宏只在另一个宏的定义中使用？局部宏的意义就类似于编程语言中的局部变量，如果没有局部宏，那么在一个全局的空间中，很容易出现宏名冲突，导致宏被意外的重定义了。

为了避免宏名冲突，一种可选的方法是在宏名之前加前缀，比如使用 local 作为局部宏名的前缀。不过，这种方法对于递归宏无效。更好的方法是用栈。

m4 实际上是用一个栈来维护宏的定义的。当前宏的定义位于栈顶。使用 pushdef 可以将一个临时定义的宏压入栈中，在利用完这个临时的宏之后，再用 popdef 将其弹出栈外。例如：

define(`USED',1)
define(`proc',
  `pushdef(`USED',10)pushdef(`UNUSED',20)dnl
`'`USED' = USED, `UNUSED' = UNUSED`'dnl
`'popdef(`USED',`UNUSED')')
proc     # -> USED = 10, UNUSED = 20
USED     # -> 1

如果被压入栈的宏是未定义的宏，那么 pushdef 就相当于 define。如果 popdef 弹出的宏也是未定义的宏，popdef 就相当于 undefine，它不会产生任何抱怨。

GNU m4 认为 define(X, Y) 与 popdef(X)pushdef(X, Y) 等价。其他的 m4 实现会认为 define(X) 等价于 undefine(X)define(X, Y)，也就是说，新的宏的定义会更新整个栈。 undefine(X) 就是取消 X 宏的定义，使之成为未定义的宏。

让宏名更安全

m4 有一个 -P 选项，它可以强制性的在其内建宏名之前冠以 m4_ 前缀。例如下面的 M1.m4 文件：

define(`M1',`text1')M1          # -> define(M1,text1)M1
m4_define(`M1',`text1')M1       # -> text1

直接用 m4 处理，结果为：

$ m4 M1.m4
text1          # -> define(M1,text1)M1
m4_define(M1,text1)text1       # -> text1

如果用 m4 -P 来处理，结果为：

$ m4 -P test.m4
define(M1,text1)M1          # -> define(M1,text1)M1
text1       # -> text1

挑战

理解 for 宏的定义。

下一篇：http://segmentfault.com/a/1190000004137562

让这世界再多一份 GNU m4 教程 (4)

递归

循环

宏参数列表的特征值

宏的作用域

让宏名更安全

挑战

相关阅读

相关文章

相关问答

相关文档