Built in 变量
AWK提供了几个内置变量。 在编写AWK脚本时,它们发挥着重要作用。 本章演示了内置变量的用法。
标准AWK变量
标准AWK变量将在下面讨论。
ARGC
它表示命令行提供的参数数量。
Example
[jerry]$ awk 'BEGIN {print "Arguments =", ARGC}' One Two Three Four
执行此代码时,您将获得以下结果 -
Output
Arguments = 5
但是为什么当你只传递4个参数时AWK会显示5? 只需查看以下示例即可清除您的疑问。
ARGV
它是一个存储命令行参数的数组。 数组的有效索引范围从0到ARGC-1。
Example
[jerry]$ awk 'BEGIN {
for (i = 0; i < ARGC - 1; ++i) {
printf "ARGV[%d] = %s\n", i, ARGV[i]
}
}' one two three four
执行此代码时,您将获得以下结果 -
Output
ARGV[0] = awk
ARGV[1] = one
ARGV[2] = two
ARGV[3] = three
CONVFMT
它代表数字的转换格式。 其默认值为%.6g 。
Example
[jerry]$ awk 'BEGIN { print "Conversion Format =", CONVFMT }'
执行此代码时,您将获得以下结果 -
Output
Conversion Format = %.6g
ENVIRON
它是环境变量的关联数组。
Example
[jerry]$ awk 'BEGIN { print ENVIRON["USER"] }'
执行此代码时,您将获得以下结果 -
Output
jerry
要查找其他环境变量的名称,请使用env命令。
FILENAME
它表示当前文件名。
Example
[jerry]$ awk 'END {print FILENAME}' marks.txt
执行此代码时,您将获得以下结果 -
Output
marks.txt
请注意,BEGIN块中未定义FILENAME。
FS
它表示(输入)字段分隔符,其默认值为空格。 您也可以使用-F命令行选项更改此设置。
Example
[jerry]$ awk 'BEGIN {print "FS = " FS}' | cat -vte
执行此代码时,您将获得以下结果 -
Output
FS = $
NF
它表示当前记录中的字段数。 例如,以下示例仅打印包含两个以上字段的行。
Example
[jerry]$ echo -e "One Two\nOne Two Three\nOne Two Three Four" | awk 'NF > 2'
执行此代码时,您将获得以下结果 -
Output
One Two Three
One Two Three Four
NR
它代表当前记录的编号。 例如,以下示例在当前记录号小于3时打印记录。
Example
[jerry]$ echo -e "One Two\nOne Two Three\nOne Two Three Four" | awk 'NR < 3'
执行此代码时,您将获得以下结果 -
Output
One Two
One Two Three
FNR
它类似于NR,但相对于当前文件。 当AWK在多个文件上运行时,它很有用。 FNR的值重置为新文件。
OFMT
它表示输出格式编号,其默认值为%.6g 。
Example
[jerry]$ awk 'BEGIN {print "OFMT = " OFMT}'
执行此代码时,您将获得以下结果 -
Output
OFMT = %.6g
OFS
它表示输出字段分隔符,其默认值为space。
Example
[jerry]$ awk 'BEGIN {print "OFS = " OFS}' | cat -vte
执行此代码时,您将获得以下结果 -
Output
OFS = $
ORS
它表示输出记录分隔符,其默认值为换行符。
Example
[jerry]$ awk 'BEGIN {print "ORS = " ORS}' | cat -vte
执行上面的代码时,您会得到以下结果 -
Output
ORS = $
$
RLENGTH
它表示match函数匹配的字符串的长度。 AWK的匹配函数在输入字符串中搜索给定的字符串。
Example
[jerry]$ awk 'BEGIN { if (match("One Two Three", "re")) { print RLENGTH } }'
执行此代码时,您将获得以下结果 -
Output
2
RS
它表示(输入)记录分隔符,其默认值为换行符。
Example
[jerry]$ awk 'BEGIN {print "RS = " RS}' | cat -vte
执行此代码时,您将获得以下结果 -
Output
RS = $
$
RSTART
它表示match函数匹配的字符串中的第一个位置。
Example
[jerry]$ awk 'BEGIN { if (match("One Two Three", "Thre")) { print RSTART } }'
执行此代码时,您将获得以下结果 -
Output
9
SUBSEP
它表示数组下标的分隔符,其默认值为\034 。
Example
[jerry]$ awk 'BEGIN { print "SUBSEP = " SUBSEP }' | cat -vte
执行此代码时,您将获得以下结果 -
Output
SUBSEP = ^\$
$0
它代表整个输入记录。
Example
[jerry]$ awk '{print $0}' marks.txt
执行此代码时,您将获得以下结果 -
Output
1) Amit Physics 80
2) Rahul Maths 90
3) Shyam Biology 87
4) Kedar English 85
5) Hari History 89
$n
它表示当前记录中第 n 个字段,其中字段由FS分隔。
Example
[jerry]$ awk '{print $3 "\t" $4}' marks.txt
执行此代码时,您将获得以下结果 -
Output
Physics 80
Maths 90
Biology 87
English 85
History 89
GNU AWK特定变量
GNU AWK具体变量如下 -
ARGIND
它表示正在处理的当前文件的ARGV中的索引。
Example
[jerry]$ awk '{
print "ARGIND = ", ARGIND; print "Filename = ", ARGV[ARGIND]
}' junk1 junk2 junk3
执行此代码时,您将获得以下结果 -
Output
ARGIND = 1
Filename = junk1
ARGIND = 2
Filename = junk2
ARGIND = 3
Filename = junk3
BINMODE
它用于为非POSIX系统上的所有文件I/O指定二进制模式。 数字值1,2或3分别指定输入文件,输出文件或所有文件应使用二进制I/O. r或w字符串值分别指定输入文件或输出文件应使用二进制I/O. rw或wr字符串值指定所有文件都应使用二进制I/O.
ERRNO
字符串表示当getline重定向失败或者close调用失败时出错。
Example
[jerry]$ awk 'BEGIN { ret = getline < "junk.txt"; if (ret == -1) print "Error:", ERRNO }'
执行此代码时,您将获得以下结果 -
Output
Error: No such file or directory
FIELDWIDTHS
设置了以空格分隔的字段宽度变量列表,GAWK将输入解析为固定宽度的字段,而不是使用FS变量的值作为字段分隔符。
IGNORECASE
设置此变量后,GAWK将不区分大小写。 以下示例演示了这一点 -
Example
[jerry]$ awk 'BEGIN{IGNORECASE = 1} /amit/' marks.txt
执行此代码时,您将获得以下结果 -
Output
1) Amit Physics 80
LINT
它提供了GAWK程序中--lint选项的动态控制。 设置此变量后,GAWK会打印lint警告。 当分配字符串值致命时,lint警告会成为致命错误,就像--lint=fatal 。
Example
[jerry]$ awk 'BEGIN {LINT = 1; a}'
执行此代码时,您将获得以下结果 -
Output
awk: cmd. line:1: warning: reference to uninitialized variable `a'
awk: cmd. line:1: warning: statement has no effect
PROCINFO
这是一个关联数组,包含有关进程的信息,例如实际和有效的UID号,进程ID号等。
Example
[jerry]$ awk 'BEGIN { print PROCINFO["pid"] }'
执行此代码时,您将获得以下结果 -
Output
4316
TEXTDOMAIN
它代表AWK程序的文本域。 它用于查找程序字符串的本地化翻译。
Example
[jerry]$ awk 'BEGIN { print TEXTDOMAIN }'
执行此代码时,您将获得以下结果 -
Output
messages
由于en_IN语言环境,上面的输出显示英文文本