设置字段定界符
默认的字段定界符是空格,可以使用-F “定界符” 明确指定一个定界符:
代码语言:javascript复制awk -F: '{ print $NF }' /etc/passwd
# 或
awk 'BEGIN{ FS=":" } { print $NF }' /etc/passwd
在BEGIN语句块中则可以用OFS=“定界符”设置输出字段的定界符。
流程控制语句
在linux awk的while、do-while和for语句中允许使用break,continue语句来控制流程走向,也允许使用exit这样的语句来退出。break中断当前正在执行的循环并跳到循环外执行下一条语句。if 是流程选择用法。awk中,流程控制语句,语法结构,与c语言类型。有了这些语句,其实很多shell程序都可以交给awk,而且性能是非常快的。下面是各个语句用法。
条件判断语句
代码语言:javascript复制if(表达式)
语句1
else
语句2
格式中语句1可以是多个语句,为了方便判断和阅读,最好将多个语句用{}括起来。awk分枝结构允许嵌套,其格式为:
代码语言:javascript复制if(表达式)
{语句1}
else if(表达式)
{语句2}
else
{语句3}
示例:
代码语言:javascript复制awk 'BEGIN{
test=100;
if(test>90){
print "very good";
}
else if(test>60){
print "good";
}
else{
print "no pass";
}
}'
输出:
代码语言:javascript复制very good
每条命令语句后面可以用; 分号 结尾。
循环语句
while语句
代码语言:javascript复制while(表达式)
{语句}
示例:
代码语言:javascript复制awk 'BEGIN{
test=100;
total=0;
while(i<=test){
total =i;
i ;
}
print total;
}'
输出:
代码语言:javascript复制5050
for循环
for循环有两种格式:
格式1:
代码语言:javascript复制for(变量 in 数组)
{语句}
示例:
代码语言:javascript复制awk 'BEGIN{
for(k in ENVIRON){
print k"="ENVIRON[k];
}
}'
输出:
代码语言:javascript复制TERM=linux
G_BROKEN_FILENAMES=1
SHLVL=1
pwd=/root/text
...
logname=root
HOME=/root
SSH_CLIENT=192.168.1.21 53087 22
注:ENVIRON是awk常量,是子典型数组。
格式2:
代码语言:javascript复制for(变量;条件;表达式)
{语句}
示例:
代码语言:javascript复制awk 'BEGIN{
total=0;
for(i=0;i<=100;i ){
total =i;
}
print total;
}'
输出:
代码语言:javascript复制5050
do循环
代码语言:javascript复制do
{语句} while(条件)
例子:
代码语言:javascript复制awk 'BEGIN{
total=0;
i=0;
do {total =i;i ;} while(i<=100)
print total;
}'
输出:
代码语言:javascript复制5050
其他语句
- break 当 break 语句用于 while 或 for 语句时,导致退出程序循环。
- continue 当 continue 语句用于 while 或 for 语句时,使程序循环移动到下一个迭代。
- next 能能够导致读入下一个输入行,并返回到脚本的顶部。这可以避免对当前输入行执行其他的操作过程。
- exit 语句使主输入循环退出并将控制转移到END,如果END存在的话。如果没有定义END规则,或在END中应用exit语句,则终止脚本的执行。
数组应用
数组是awk的灵魂,处理文本中最不能少的就是它的数组处理。因为数组索引(下标)可以是数字和字符串在awk中数组叫做关联数组(associative arrays)。awk 中的数组不必提前声明,也不必声明大小。数组元素用0或空字符串来初始化,这根据上下文而定。
数组的定义
数字做数组索引(下标):
代码语言:javascript复制Array[1]="sun"
Array[2]="kai"
字符串做数组索引(下标):
代码语言:javascript复制Array["first"]="www"
Array"[last"]="name"
Array["birth"]="1987"
使用中print Array[1]会打印出sun;使用print Array[2]会打印出kai;使用print[“birth”]会得到1987。
读取数组的值
代码语言:javascript复制{ for(item in array) {print array[item]}; } #输出的顺序是随机的
{ for(i=1;i<=len;i ) {print array[i]}; } #Len是数组的长度
数组相关函数
得到数组长度:
代码语言:javascript复制awk 'BEGIN{info="it is a test";lens=split(info,tA," ");print length(tA),lens;}'
输出:
代码语言:javascript复制4 4
length返回字符串以及数组长度,split进行分割字符串为数组,也会返回分割得到数组长度。
代码语言:javascript复制awk 'BEGIN{info="it is a test";split(info,tA," ");print asort(tA);}'
输出:
代码语言:javascript复制4
asort对数组进行排序,返回数组长度。
输出数组内容(无序,有序输出):
代码语言:javascript复制awk 'BEGIN{info="it is a test";split(info,tA," ");for(k in tA){print k,tA[k];}}'
输出:
代码语言:javascript复制4 test
1 it
2 is
3 a
for…in输出,因为数组是关联数组,默认是无序的。所以通过for…in得到是无序的数组。如果需要得到有序数组,需要通过下标获得。
代码语言:javascript复制awk 'BEGIN{info="it is a test";tlen=split(info,tA," ");for(k=1;k<=tlen;k ){print k,tA[k];}}'
输出:
代码语言:javascript复制1 it
2 is
3 a
4 test
注意:数组下标是从1开始,与C数组不一样。
判断键值存在以及删除键值:
错误的判断方法:
代码语言:javascript复制awk 'BEGIN{tB["a"]="a1";tB["b"]="b1";if(tB["c"]!="1"){print "no found";};for(k in tB){print k,tB[k];}}'
输出:
代码语言:javascript复制no found
a a1
b b1
c
以上出现奇怪问题,tB[“c”]没有定义,但是循环时候,发现已经存在该键值,它的值为空,这里需要注意,awk数组是关联数组,只要通过数组引用它的key,就会自动创建改序列。
正确判断方法:
代码语言:javascript复制awk 'BEGIN{tB["a"]="a1";tB["b"]="b1";if( "c" in tB){print "ok";};for(k in tB){print k,tB[k];}}'
输出:
代码语言:javascript复制a a1
b b1
if(key in array)通过这种方法判断数组中是否包含key键值。
删除键值:
代码语言:javascript复制awk 'BEGIN{tB["a"]="a1";tB["b"]="b1";delete tB["a"];for(k in tB){print k,tB[k];}}'
输出:
代码语言:javascript复制b b1
delete array[key]可以删除,对应数组key的,序列值。
二维、多维数组使用
awk的多维数组在本质上是一维数组,更确切一点,awk在存储上并不支持多维数组。awk提供了逻辑上模拟二维数组的访问方式。例如,array[2,4]=1这样的访问是允许的。awk使用一个特殊的字符串SUBSEP(�34)作为分割字段,在上面的例子中,关联数组array存储的键值实际上是2�344。
类似一维数组的成员测试,多维数组可以使用if ( (i,j) in array)这样的语法,但是下标必须放置在圆括号中。类似一维数组的循环访问,多维数组使用for ( item in array )这样的语法遍历数组。与一维数组不同的是,多维数组必须使用split()函数来访问单独的下标分量。
代码语言:javascript复制awk 'BEGIN{
for(i=1;i<=9;i ){
for(j=1;j<=9;j ){
tarr[i,j]=i*j; print i,"*",j,"=",tarr[i,j];
}
}
}'
输出:
代码语言:javascript复制1 * 1 = 1
1 * 2 = 2
1 * 3 = 3
1 * 4 = 4
1 * 5 = 5
1 * 6 = 6
...
9 * 6 = 54
9 * 7 = 63
9 * 8 = 72
9 * 9 = 81
可以通过array[k,k2]引用获得数组内容。
另一种方法:
代码语言:javascript复制awk 'BEGIN{
for(i=1;i<=9;i ){
for(j=1;j<=9;j ){
tarr[i,j]=i*j;
}
}
for(m in tarr){
split(m,tarr2,SUBSEP); print tarr2[1],"*",tarr2[2],"=",tarr[m];
}
}'