第五部分 进阶话题 - 19. 嵌入文档

Here and now, boys.
    —Aldous Huxley, Island

嵌入文档是一段有特殊作用的代码块,它用 I/O 重定向 在交互程序和交互命令中传递和反馈一个命令列表,例如 ftpcat 或者是 ex 文本编辑器

  1. COMMAND <<InputComesFromHERE
  2. ...
  3. ...
  4. ...
  5. InputComesFromHERE

嵌入文档用限定符作为命令列表的边界,在限定符前需要一个指定的标识符 <<,这会将一个程序或命令的标准输入(stdin)进行重定向,它类似 交互程序 < 命令文件 的方式,其中命令文件内容如下

  1. command #1
  2. command #2
  3. ...


  1. interactive-program <<LimitString
  2. command #1
  3. command #2
  4. ...
  5. LimitString


注意嵌入文档有时候用作非交互的工具和命令有着非常好的效果,例如 wall

样例 19-1. broadcast: 给每个登陆者发送信息

  1. #!/bin/bash
  2. wall <<zzz23EndOfMessagezzz23
  3. E-mail your noontime orders for pizza to the system administrator.
  4. (Add an extra dollar for anchovy or mushroom topping.)
  5. # 额外的信息文本.
  6. # 注意: 'wall' 会打印注释行.
  7. zzz23EndOfMessagezzz23
  8. # 更有效的做法是通过
  9. # wall < 信息文本
  10. # 然而, 在脚本里嵌入信息模板不乏是一种迅速而又随性的解决方式.
  11. exit

样例: 19-2. dummyfile:创建一个有两行内容的虚拟文件

  1. #!/bin/bash
  2. # 非交互的使用 `vi` 编辑文件.
  3. # 仿照 'sed'.
  4. E_BADARGS=85
  5. if [ -z "$1" ]
  6. then
  7. echo "Usage: `basename $0` filename"
  8. exit $E_BADARGS
  9. fi
  11. # 插入两行到文件中保存
  12. #--------Begin here document-----------#
  13. vi $TARGETFILE <<x23LimitStringx23
  14. i
  15. This is line 1 of the example file.
  16. This is line 2 of the example file.
  17. ^[
  18. ZZ
  19. x23LimitStringx23
  20. #----------End here document-----------#
  21. # 注意 "^" 对 "[" 进行了转义
  22. #+ 这段起到了和键盘上按下 Control-V <Esc> 相同的效果.
  23. # Bram Moolenaar 指出这种情况下 'vim' 可能无法正常工作
  24. #+ 因为在与终端交互的过程中可能会出现问题.
  25. exit

上述脚本实现了 ex 的功能, 而不是 vi. 嵌入文档包含了 ex 足够通用的命令列表来形成自有的类别, 所以又称之为 ex 脚本.

  1. #!/bin/bash
  2. # 替换所有的以 ".txt" 后缀结尾的文件的 "Smith" 为 "Jones"
  3. ORIGINAL=Smith
  5. for word in $(fgrep -l $ORIGINAL *.txt)
  6. do
  7. # -------------------------------------
  8. ex $word <<EOF
  10. :wq
  11. EOF
  12. # :%s is the "ex" substitution command.
  13. # :wq is write-and-quit.
  14. # -------------------------------------
  15. done

类似的 ex 脚本cat 脚本.

样例 19-3. 使用 cat 的多行信息

  1. #!/bin/bash
  2. # 'echo' 可以输出单行信息,
  3. #+ 但是如果是输出消息块就有点问题了.
  4. # 'cat' 嵌入文档却能解决这个局限.
  5. cat <<End-of-message
  6. -------------------------------------
  7. This is line 1 of the message.
  8. This is line 2 of the message.
  9. This is line 3 of the message.
  10. This is line 4 of the message.
  11. This is the last line of the message.
  12. -------------------------------------
  13. End-of-message
  14. # 替换上述嵌入文档内的 7 行文本
  15. #+ cat > $Newfile <<End-of-message
  16. #+ ^^^^^^^^^^
  17. #+ 将输出追加到 $Newfile, 而不是标准输出.
  18. exit 0
  19. #--------------------------------------------
  20. # 由于上面的 "exit 0",下面的代码将不会生效.
  21. # S.C. points out that the following also works.
  22. echo "-------------------------------------
  23. This is line 1 of the message.
  24. This is line 2 of the message.
  25. This is line 3 of the message.
  26. This is line 4 of the message.
  27. This is the last line of the message.
  28. -------------------------------------"
  29. # 然而, 文本可能不包括双引号除非出现了字符串逃逸.

- 的作用是标记了一个嵌入文档限制符 (<<-LimitString) ,它能抑制输出的行首的 tab (非空格). 这在脚本可读性方面可能非常有用.

样例 19-4. 抑制 tab 的多行信息

  1. #!/bin/bash
  2. # 和之前的样例一样, 但...
  3. # 嵌入文档内的 '-' ,也就是 <<-
  4. #+ 抑制了文档行首的 'tab',
  5. #+ 但 *不是* 空格.
  6. cat <<-ENDOFMESSAGE
  7. This is line 1 of the message.
  8. This is line 2 of the message.
  9. This is line 3 of the message.
  10. This is line 4 of the message.
  11. This is the last line of the message.
  13. # 脚本的输出将左对齐.
  14. # 行首的 tab 将不会输出.
  15. # 上面 5 行的 "信息" 以 tab 开始, 不是空格.
  16. # 空格不会受影响 <<- .
  17. # 注意这个选项对 *内嵌的* tab 没有影响.
  18. exit 0

嵌入文档支持参数和命令替换. 因此可以向嵌入文档传递不同的参数,变向的改其输出.

样例 19-5. 可替换参数的嵌入文档

  1. #!/bin/bash
  2. # 另一个使用参数替换的 'cat' 嵌入文档.
  3. # 试一试没有命令行参数, ./scriptname
  4. # 试一试一个命令行参数, ./scriptname Mortimer
  5. # 试试用一两个单词引用命令行参数,
  6. # ./scriptname "Mortimer Jones"
  7. CMDLINEPARAM=1 # Expect at least command-line parameter.
  8. if [ $# -ge $CMDLINEPARAM ]
  9. then
  10. NAME=$1 # If more than one command-line param,
  11. #+ then just take the first.
  12. else
  13. NAME="John Doe" # Default, if no command-line parameter.
  14. fi
  15. RESPONDENT="the author of this fine script"
  16. cat <<Endofmessage
  17. Hello, there, $NAME.
  18. Greetings to you, $NAME, from $RESPONDENT.
  19. # 这个注释在输出时显示 (为什么?).
  20. Endofmessage
  21. # 注意输出了空行.
  22. # 所以可以这样注释.
  23. exit


样例 19-6. 上传文件对到 Sunsite 入口目录

  1. #!/bin/bash
  2. # upload.sh
  3. # 上传文件对 (Filename.lsm, Filename.tar.gz)
  4. #+ 到 Sunsite/UNC (ibiblio.org) 的入口目录.
  5. # Filename.tar.gz 是个 tarball.
  6. # Filename.lsm is 是个描述文件.
  7. # Sunsite 需要 "lsm" 文件, 否则将会退回给发送者
  8. E_ARGERROR=85
  9. if [ -z "$1" ]
  10. then
  11. echo "Usage: `basename $0` Filename-to-upload"
  12. exit $E_ARGERROR
  13. fi
  14. Filename=`basename $1` # Strips pathname out of file name.
  15. Server="ibiblio.org"
  16. Directory="/incoming/Linux"
  17. # 脚本里不需要硬编码,
  18. #+ 但最好可以替换命令行参数.
  19. Password="your.e-mail.address" # Change above to suit.
  20. ftp -n $Server <<End-Of-Session
  21. # -n 禁用自动登录
  22. user anonymous "$Password" # If this doesn't work, then try:
  23. # quote user anonymous "$Password"
  24. binary
  25. bell # Ring 'bell' after each file transfer.
  26. cd $Directory
  27. put "$Filename.lsm"
  28. put "$Filename.tar.gz"
  29. bye
  30. End-Of-Session
  31. exit 0

在嵌入文档头部引用或转义”限制符”来禁用参数替换.原因是 引用/转义 限定符能有效的转义 “$”, “`”, 和 “” 这些特殊符号, 使他们维持字面上的意思. (感谢 Allen Halsey 指出这点.)

样例 19-7. 禁用参数替换

  1. #!/bin/bash
  2. # A 'cat' here-document, but with parameter substitution disabled.
  3. NAME="John Doe"
  4. RESPONDENT="the author of this fine script"
  5. cat <<'Endofmessage'
  6. Hello, there, $NAME.
  7. Greetings to you, $NAME, from $RESPONDENT.
  8. Endofmessage
  9. # 当'限制符'引用或转义时不会有参数替换.
  10. # 下面的嵌入文档也有同样的效果
  11. # cat <<"Endofmessage"
  12. # cat <<Endofmessage
  13. # 同样的:
  14. cat <<"SpecialCharTest"
  15. Directory listing would follow
  16. if limit string were not quoted.
  17. `ls -l`
  18. Arithmetic expansion would take place
  19. if limit string were not quoted.
  20. $((5 + 3))
  21. A a single backslash would echo
  22. if limit string were not quoted.
  23. \
  24. SpecialCharTest
  25. exit


样例 19-8. 生成其他脚本的脚本

  1. #!/bin/bash
  2. # generate-script.sh
  3. # Based on an idea by Albert Reiner.
  4. OUTFILE=generated.sh # Name of the file to generate.
  5. # -----------------------------------------------------------
  6. # '嵌入文档涵盖了生成脚本的主体部分.
  7. (
  8. cat <<'EOF'
  9. #!/bin/bash
  10. echo "This is a generated shell script."
  11. # 注意我们现在在一个子 shell 内,
  12. #+ 我们不能访问 "外部" 脚本变量.
  13. echo "Generated file will be named: $OUTFILE"
  14. # 上面这行并不能按照预期的正常工作
  15. #+ 因为参数扩展已被禁用.
  16. # 相反的, 结果是文字输出.
  17. a=7
  18. b=3
  19. let "c = $a * $b"
  20. echo "c = $c"
  21. exit 0
  22. EOF
  23. ) > $OUTFILE
  24. # -----------------------------------------------------------
  25. # 在上述的嵌入文档内引用'限制符'防止变量扩展
  26. if [ -f "$OUTFILE" ]
  27. then
  28. chmod 755 $OUTFILE
  29. # 生成可执行文件.
  30. else
  31. echo "Problem in creating file: "$OUTFILE""
  32. fi
  33. # 这个方法适用于生成 C, Perl, Python, Makefiles 等等
  34. exit 0

可以从嵌入文档的输出设置一个变量的值. 这实际上是种灵活的 命令替换.

  1. variable=$(cat <<SETVAR
  2. This variable
  3. runs over multiple lines.
  5. )
  6. echo "$variable"


样例 19-9. 嵌入文档和函数

  1. #!/bin/bash
  2. # here-function.sh
  3. GetPersonalData ()
  4. {
  5. read firstname
  6. read lastname
  7. read address
  8. read city
  9. read state
  10. read zipcode
  11. } # 可以肯定的是这应该是个交互式的函数, 但 . . .
  12. # 作为函数的输入.
  13. GetPersonalData <<RECORD001
  14. Bozo
  15. Bozeman
  16. 2726 Nondescript Dr.
  17. Bozeman
  18. MT
  19. 21226
  20. RECORD001
  21. echo
  22. echo "$firstname $lastname"
  23. echo "$address"
  24. echo "$city, $state $zipcode"
  25. echo
  26. exit 0

可以这样使用: 作为一个虚构的命令接受嵌入文档的输出. 这样实际上就创建了一个 “匿名” 嵌入文档.

样例 19-10. “匿名” 嵌入文档

  1. #!/bin/bash
  3. ${HOSTNAME?}${USER?}${MAIL?} # Print error message if one of the variables not set.
  5. exit $?
  • 上面技巧的一种变体允许 “可添加注释” 的代码块.

样例 19-11. 可添加注释的代码块

  1. #!/bin/bash
  2. # commentblock.sh
  4. echo "This line will not echo."
  5. 这些注释没有 "#" 前缀.
  6. 则是另一种没有 "#" 前缀的注释方法.
  7. &*@!!++=
  8. 上面这行不会产生报错信息,
  9. 因为 bash 解释器会忽略它.
  11. echo "Exit value of above "COMMENTBLOCK" is $?." # 0
  12. # 没有错误输出.
  13. echo
  14. # 上面的技巧经常用于工作代码的注释用作排错目的
  15. # 这省去了在每一行开头加上 "#" 前缀,
  16. #+ 然后调试完不得不删除每行的前缀的重复工作.
  17. # 注意我们用了 ":", 在这之上,是可选的.
  18. echo "Just before commented-out code block."
  19. # 下面这个在双破折号之间的代码不会被执行.
  20. # ===================================================================
  21. : <<DEBUGXXX
  22. for file in *
  23. do
  24. cat "$file"
  25. done
  27. # ===================================================================
  28. echo "Just after commented-out code block."
  29. exit 0
  30. ######################################################################
  31. # 注意, 然而, 如果将变量中包含一个注释的代码块将会引发问题
  32. # 例如:
  33. #/!/bin/bash
  35. echo "This line will not echo."
  36. &*@!!++=
  37. ${foo_bar_bazz?}
  38. $(rm -rf /tmp/foobar/)
  39. $(touch my_build_directory/cups/Makefile)
  41. $ sh commented-bad.sh
  42. commented-bad.sh: line 3: foo_bar_bazz: parameter null or not set
  43. # 有效的补救办法就是在 49 行的位置加上单引号,变为 'COMMENTBLOCK'.
  44. : <<'COMMENTBLOCK'
  45. # 感谢 Kurt Pfeifle 指出这一点.
  • 另一个漂亮的方法使得”自文档化”的脚本成为可能

样例 19-12. 自文档化的脚本

  1. #!/bin/bash
  2. # self-document.sh: self-documenting script
  3. # Modification of "colm.sh".
  5. if [ "$1" = "-h" -o "$1" = "--help" ] # 请求帮助.
  6. then
  7. echo; echo "Usage: $0 [directory-name]"; echo
  8. sed --silent -e '/DOCUMENTATIONXX$/,/^DOCUMENTATIONXX$/p' "$0" |
  9. sed -e '/DOCUMENTATIONXX$/d'; exit $DOC_REQUEST; fi
  11. List the statistics of a specified directory in tabular format.
  12. ---------------------------------------------------------------
  13. The command-line parameter gives the directory to be listed.
  14. If no directory specified or directory specified cannot be read,
  15. then list the current working directory.
  17. if [ -z "$1" -o ! -r "$1" ]
  18. then
  19. directory=.
  20. else
  21. directory="$1"
  22. fi
  23. echo "Listing of "$directory":"; echo
  25. ; ls -l "$directory" | sed 1d) | column -t
  26. exit 0

使用 cat script 是另一种可行的方法.

  2. if [ "$1" = "-h" -o "$1" = "--help" ] # Request help.
  3. then # Use a "cat script" . . .
  5. List the statistics of a specified directory in tabular format.
  6. ---------------------------------------------------------------
  7. The command-line parameter gives the directory to be listed.
  8. If no directory specified or directory specified cannot be read,
  9. then list the current working directory.
  11. exit $DOC_REQUEST
  12. fi

另请参阅 样例 A-28, 样例 A-40, 样例 A-41, and 样例 A-42 更多样例请阅读脚本附带的注释文档.

  • 嵌入文档创建了临时文件, 但这些文件在打开且不可被其他程序访问后删除.
  1. bash$ bash -c 'lsof -a -p $$ -d0' << EOF
  2. > EOF
  3. lsof 1213 bozo 0r REG 3,5 0 30386 /tmp/t1213-0-sh (deleted)
  • 某些工具在嵌入文档内部并不能正常运行.

  • 在嵌入文档的最后关闭限定符必须在起始的第一个字符的位置开始.行首不能是空格. 限制符后尾随空格同样会导致意想不到的行为.空格可以防止限制符被当做其他用途. [1]

  1. #!/bin/bash
  2. echo "----------------------------------------------------------------------"
  3. cat <<LimitString
  4. echo "This is line 1 of the message inside the here document."
  5. echo "This is line 2 of the message inside the here document."
  6. echo "This is the final line of the message inside the here document."
  7. LimitString
  8. #^^^^限制符的缩进. 出错! 这个脚本将不会如期运行.
  9. echo "----------------------------------------------------------------------"
  10. # 这些评论在嵌入文档范围外并不能输出
  11. echo "Outside the here document."
  12. exit 0
  13. echo "This line had better not echo." # 紧跟着个 'exit' 命令.
  • 有些人非常聪明的使用了一个单引号(!)做为限制符. 但这并不是个好主意
  1. # 这个可以运行.
  2. cat <<!
  3. Hello!
  4. ! Three more exclamations !!!
  5. !
  6. # 但是 . . .
  7. cat <<!
  8. Hello!
  9. Single exclamation point follows!
  10. !
  11. !
  12. # Crashes with an error message.
  13. # 然而, 下面这样也能运行.
  14. cat <<EOF
  15. Hello!
  16. Single exclamation point follows!
  17. !
  18. EOF
  19. # 使用多字符限制符更为安全.

为嵌入文档设置这些任务有些复杂, 可以考虑使用 expect, 一种专门用来和程序进行交互的脚本语言。

  除此之外, Dennis Benzinger 指出, 使用 <<- 抑制 tab.