【linux命令讲解大全】051.Linux Awk脚本语言中的字段定界符和流程控制

2024-03-02 13:15:16 浏览数 (2)

设置字段定界符

默认的字段定界符是空格,可以使用-F “定界符” 明确指定一个定界符:

代码语言:javascript复制
awk -F: '{ print $NF }' /etc/passwd
# 或
awk 'BEGIN{ FS=":" } { print $NF }' /etc/passwd

在BEGIN语句块中则可以用OFS=“定界符”设置输出字段的定界符。

流程控制语句

在linux awk的while、do-while和for语句中允许使用break,continue语句来控制流程走向,也允许使用exit这样的语句来退出。break中断当前正在执行的循环并跳到循环外执行下一条语句。if 是流程选择用法。awk中,流程控制语句,语法结构,与c语言类型。有了这些语句,其实很多shell程序都可以交给awk,而且性能是非常快的。下面是各个语句用法。

条件判断语句
代码语言:javascript复制
if(表达式)
  语句1
else
  语句2

格式中语句1可以是多个语句,为了方便判断和阅读,最好将多个语句用{}括起来。awk分枝结构允许嵌套,其格式为:

代码语言:javascript复制
if(表达式)
  {语句1}
else if(表达式)
  {语句2}
else
  {语句3}

示例:

代码语言:javascript复制
awk 'BEGIN{
test=100;
if(test>90){
  print "very good";
  }
  else if(test>60){
    print "good";
  }
  else{
    print "no pass";
  }
}'

输出:

代码语言:javascript复制
very good

每条命令语句后面可以用; 分号 结尾。

循环语句
while语句
代码语言:javascript复制
while(表达式)
  {语句}

示例:

代码语言:javascript复制
awk 'BEGIN{
test=100;
total=0;
while(i<=test){
  total =i;
  i  ;
}
print total;
}'

输出:

代码语言:javascript复制
5050
for循环

for循环有两种格式:

格式1:

代码语言:javascript复制
for(变量 in 数组)
  {语句}

示例:

代码语言:javascript复制
awk 'BEGIN{
for(k in ENVIRON){
  print k"="ENVIRON[k];
}

}'

输出:

代码语言:javascript复制
TERM=linux
G_BROKEN_FILENAMES=1
SHLVL=1
pwd=/root/text
...
logname=root
HOME=/root
SSH_CLIENT=192.168.1.21 53087 22

注:ENVIRON是awk常量,是子典型数组。

格式2:

代码语言:javascript复制
for(变量;条件;表达式)
  {语句}

示例:

代码语言:javascript复制
awk 'BEGIN{
total=0;
for(i=0;i<=100;i  ){
  total =i;
}
print total;
}'

输出:

代码语言:javascript复制
5050
do循环
代码语言:javascript复制
do
{语句} while(条件)

例子:

代码语言:javascript复制
awk 'BEGIN{ 
total=0;
i=0;
do {total =i;i  ;} while(i<=100)
  print total;
}'

输出:

代码语言:javascript复制
5050
其他语句
  • break 当 break 语句用于 while 或 for 语句时,导致退出程序循环。
  • continue 当 continue 语句用于 while 或 for 语句时,使程序循环移动到下一个迭代。
  • next 能能够导致读入下一个输入行,并返回到脚本的顶部。这可以避免对当前输入行执行其他的操作过程。
  • exit 语句使主输入循环退出并将控制转移到END,如果END存在的话。如果没有定义END规则,或在END中应用exit语句,则终止脚本的执行。

数组应用

数组是awk的灵魂,处理文本中最不能少的就是它的数组处理。因为数组索引(下标)可以是数字和字符串在awk中数组叫做关联数组(associative arrays)。awk 中的数组不必提前声明,也不必声明大小。数组元素用0或空字符串来初始化,这根据上下文而定。

数组的定义

数字做数组索引(下标):

代码语言:javascript复制
Array[1]="sun"
Array[2]="kai"

字符串做数组索引(下标):

代码语言:javascript复制
Array["first"]="www"
Array"[last"]="name"
Array["birth"]="1987"

使用中print Array[1]会打印出sun;使用print Array[2]会打印出kai;使用print[“birth”]会得到1987。

读取数组的值
代码语言:javascript复制
{ for(item in array) {print array[item]}; }       #输出的顺序是随机的
{ for(i=1;i<=len;i  ) {print array[i]}; }         #Len是数组的长度
数组相关函数

得到数组长度:

代码语言:javascript复制
awk 'BEGIN{info="it is a test";lens=split(info,tA," ");print length(tA),lens;}'

输出:

代码语言:javascript复制
4 4

length返回字符串以及数组长度,split进行分割字符串为数组,也会返回分割得到数组长度。

代码语言:javascript复制
awk 'BEGIN{info="it is a test";split(info,tA," ");print asort(tA);}'

输出:

代码语言:javascript复制
4

asort对数组进行排序,返回数组长度。

输出数组内容(无序,有序输出):

代码语言:javascript复制
awk 'BEGIN{info="it is a test";split(info,tA," ");for(k in tA){print k,tA[k];}}'

输出:

代码语言:javascript复制
4 test
1 it
2 is
3 a 

for…in输出,因为数组是关联数组,默认是无序的。所以通过for…in得到是无序的数组。如果需要得到有序数组,需要通过下标获得。

代码语言:javascript复制
awk 'BEGIN{info="it is a test";tlen=split(info,tA," ");for(k=1;k<=tlen;k  ){print k,tA[k];}}'

输出:

代码语言:javascript复制
1 it
2 is
3 a
4 test

注意:数组下标是从1开始,与C数组不一样。

判断键值存在以及删除键值:

错误的判断方法:

代码语言:javascript复制
awk 'BEGIN{tB["a"]="a1";tB["b"]="b1";if(tB["c"]!="1"){print "no found";};for(k in tB){print k,tB[k];}}' 

输出:

代码语言:javascript复制
no found
a a1
b b1
c

以上出现奇怪问题,tB[“c”]没有定义,但是循环时候,发现已经存在该键值,它的值为空,这里需要注意,awk数组是关联数组,只要通过数组引用它的key,就会自动创建改序列。

正确判断方法:

代码语言:javascript复制
awk 'BEGIN{tB["a"]="a1";tB["b"]="b1";if( "c" in tB){print "ok";};for(k in tB){print k,tB[k];}}'  

输出:

代码语言:javascript复制
a a1
b b1

if(key in array)通过这种方法判断数组中是否包含key键值。

删除键值:

代码语言:javascript复制
awk 'BEGIN{tB["a"]="a1";tB["b"]="b1";delete tB["a"];for(k in tB){print k,tB[k];}}'                     

输出:

代码语言:javascript复制
b b1

delete array[key]可以删除,对应数组key的,序列值。

二维、多维数组使用

awk的多维数组在本质上是一维数组,更确切一点,awk在存储上并不支持多维数组。awk提供了逻辑上模拟二维数组的访问方式。例如,array[2,4]=1这样的访问是允许的。awk使用一个特殊的字符串SUBSEP(�34)作为分割字段,在上面的例子中,关联数组array存储的键值实际上是2�344。

类似一维数组的成员测试,多维数组可以使用if ( (i,j) in array)这样的语法,但是下标必须放置在圆括号中。类似一维数组的循环访问,多维数组使用for ( item in array )这样的语法遍历数组。与一维数组不同的是,多维数组必须使用split()函数来访问单独的下标分量。

代码语言:javascript复制
awk 'BEGIN{
for(i=1;i<=9;i  ){
  for(j=1;j<=9;j  ){
    tarr[i,j]=i*j; print i,"*",j,"=",tarr[i,j];
  }
}
}'

输出:

代码语言:javascript复制
1 * 1 = 1
1 * 2 = 2
1 * 3 = 3
1 * 4 = 4
1 * 5 = 5
1 * 6 = 6 
...
9 * 6 = 54
9 * 7 = 63
9 * 8 = 72
9 * 9 = 81

可以通过array[k,k2]引用获得数组内容。

另一种方法:

代码语言:javascript复制
awk 'BEGIN{
for(i=1;i<=9;i  ){
  for(j=1;j<=9;j  ){
    tarr[i,j]=i*j;
  }
}
for(m in tarr){
  split(m,tarr2,SUBSEP); print tarr2[1],"*",tarr2[2],"=",tarr[m];
}
}'

0 人点赞