Linux系统正则表达式的介绍
学习Linux系统的朋友们肯定都会接触到正则表达式,或者开发人员也会遇到这个东东,说起正则表达式,使我想起“会者不难,难者不会”这句话,的确如此,相信很多人刚接触正则表达式,肯定一头雾水,觉得很难学会,是的,民工哥也是这么个感觉,但是相信大家都认真去学习、去练习,肯定能学会的。
那么今天就来聊一聊正则表达式
何谓正则表达式呢?网上一堆的名词介绍,大家可以自己查找,民工哥的理解是:首先它是一种文本模式,然后它的作用就处理字符串的一种方法
给定一个正则表达式和另一个字符串,我们可以达到如下的目的
1. 给定的字符串是否符合正则表达式的过滤逻辑(称作“匹配”)
2. 可以通过正则表达式,从字符串中获取我们想要的特定部分
正则表达式的特点是:
1. 灵活性、逻辑性和功能性非常的强
2. 可以迅速地用极简单的方式达到字符串的复杂控制
3. 对于刚接触的人来说,比较难懂
因些我们也是有必要了解下正则需要用到的字符含义
转义符,就是将特殊符号的意义去除掉
.任意一个字符
* 重复零个或者多个*前的一个字符
{n,m连续n到m个前一个重复字符
[ ]字符集合
.*匹配所有字符
^匹配以以某字符开头
$匹配以以某字符结尾
[^]取反
^.*匹配多个任意字符开头
|或
[A-Z] 26个大写字母 [a-z] 26个小写字母 [0-9] 0至9数字
[A-Za-z0-9] 26个大写字母、26个小写字母和0至9数字
d匹配一个数字字符
w匹配包括下划线的任意单词字符
grep 文本搜索工具
grep 参数 查找条件 文件名
主要参数:
-c:只输出匹配行的计数
-I:不区分大 小写(只适用于单字符
-l:查询多文件时只输出包含匹配字符的文件名
-n:显示匹配行及 行号
-s:不显示不存在或无匹配文本的错误信息
-v:显示不包含匹配文本的所有行
sed 在线编辑工具
[root@Centos bbs]# man sed
NAME
sed - stream editor for filtering and transforming text
用于过滤或转换文本的流编辑器
sed 参数 动作
主要参数:
-n:取消默认输出
-i:修改文件内容
动作:
p 打印
d 删除
s#x#xx#g 替换与全局替换 将X全局替换掉XX
awk 文本处理工具
[root@Centos /]# man awk
NAME
gawk - pattern scanning and processing language
awk '条件1 {动作1} 条件2{动作2}........' 文件名
-F 使用分隔符
==等于
NR 取行
grep、sed、awk的参数非常的多,大家有兴趣可以慢慢研究,查看帮助文档
举例说明
例一:将系统用ifconfig命令列出的信息中eth0的IP地址打印出来
也就是说用命令将192.168.1.2输出在屏幕上
方法一:
[root@Centos /]# ifconfig eth0 |grep "inet addr"
inet addr:192.168.1.2 Bcast:192.168.1.255 Mask:255.255.255.0
首先将带有IP地址行过滤打印出来,然后再进行过滤取出IP地址
[root@Centos /]# ifconfig eth0 |grep "inet addr"|awk -F '[ :] ' '{print $4}'
192.168.1.2
以空格和:做为分隔符, 代表前面多个重复的分隔符识为一个,将第四列打印
方法二:
代码语言:javascript复制[root@Centos /]# ifconfig eth0
eth0 Link encap:Ethernet HWaddr 00:0C:29:AA:CA:2B
inet addr:192.168.1.2 Bcast:192.168.1.255 Mask:255.255.255.0
inet6 addr: fe80::20c:29ff:feaa:ca2b/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:7005 errors:0 dropped:0 overruns:0 frame:0
TX packets:3095 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:709421 (692.7 KiB) TX bytes:454116 (443.4 KiB)
[root@Centos /]# ifconfig eth0|awk -F '[ :] ' NR==2 取整个内容第二行
inet addr:192.168.1.2 Bcast:192.168.1.255 Mask:255.255.255.0
[root@Centos /]# ifconfig eth0|awk -F '[ :] ' 'NR==2 {print $4}' 打印第四列
192.168.1.2
方法三:
代码语言:javascript复制[root@Centos /]# ifconfig eth0
eth0 Link encap:Ethernet HWaddr 00:0C:29:AA:CA:2B
inet addr:192.168.1.2 Bcast:192.168.1.255 Mask:255.255.255.0
inet6 addr: fe80::20c:29ff:feaa:ca2b/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:7271 errors:0 dropped:0 overruns:0 frame:0
TX packets:3244 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:733402 (716.2 KiB) TX bytes:473258 (462.1 KiB)
[root@Centos /]# ifconfig eth0|sed -n 2p 将第二行打印
inet addr:192.168.1.2 Bcast:192.168.1.255 Mask:255.255.255.0
[root@Centos /]# ifconfig eth0|sed -n 2p|sed 's#^.*addr:# #g'
192.168.1.2 Bcast:192.168.1.255 Mask:255.255.255.0
将以空格.*(前任意字符)addr:开头的内容替换成空输出
代码语言:javascript复制[root@Centos /]# ifconfig eth0|sed -n 2p|sed 's#^.*addr:# #g'|sed 's# Bcast.*$# #g' 将以两空格Bcast.*(后任意字符)结尾的内容替换成空输出
192.168.1.2
方法四:
代码语言:javascript复制[root@Centos /]# ifconfig eth0
eth0 Link encap:Ethernet HWaddr 00:0C:29:AA:CA:2B
inet addr:192.168.1.2 Bcast:192.168.1.255 Mask:255.255.255.0
inet6 addr: fe80::20c:29ff:feaa:ca2b/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:7723 errors:0 dropped:0 overruns:0 frame:0
TX packets:3434 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:776543 (758.3 KiB) TX bytes:493886 (482.3 KiB)
[root@Centos /]# ifconfig eth0|sed -n 's#^.*addr:(.*) Bcast.*$#1#gp'
192.168.1.2
将需要的内容匹配到()中,然后将()中的内容打印出来
例二:将/目录下etc目录的权限转换成数字输出
方法一:
代码语言:javascript复制[root@Centos /]# stat /etc stat获取文件或目录的属性信息
File: `/etc'
Size: 12288 Blocks: 24 IO Block: 4096 directory
Device: fd00h/64768d Inode: 2883585 Links: 116
Access: (0755/drwxr-xr-x) Uid: ( 0/ root) Gid: ( 0/ root)
Access: 2016-08-21 11:07:01.802852859 0800
Modify: 2016-08-21 11:06:44.569852839 0800
Change: 2016-08-21 11:06:44.569852839 0800
[root@Centos /]# stat /etc|sed -n 4p
Access: (0755/drwxr-xr-x) Uid: ( 0/ root) Gid: ( 0/ root)打印第四行
[root@Centos /]# stat /etc|sed -n 4p|cut -d "(" -f2 以(为分隔符打印第二列
0755/drwxr-xr-x) Uid:
[root@Centos /]# stat /etc|sed -n 4p|cut -d "(" -f2|cut -d "/" -f1
0755 以/为分隔符打印第二列
方法二:
代码语言:javascript复制[root@Centos /]# stat /etc|sed -n 4p|cut -d "(" -f2|cut -c 2-4
755 以(分隔符取第二列,然后再取2-4个字符
方法三:
[root@Centos /]# stat /etc|sed -n 4p|awk -F '(' '{print 2}'|awk -F '/' '{print 1}'
0755 以(分隔符打印第二列|以/分隔符打印第一列
方法四:
代码语言:javascript复制[root@Centos /]# stat /etc|sed -n 4p 打印第四行
Access: (0755/drwxr-xr-x) Uid: ( 0/ root) Gid: ( 0/ root)
[root@Centos /]# stat /etc|sed -n 4p|awk -F '[(/]' '{print $2}' 指定多分隔符
0755
方法五:其实stat 命令本身就有参数可以直接获取
代码语言:javascript复制[root@Centos /]# stat -c %a /etc
755
[root@Centos /]# stat -c %a /root
550
[root@Centos /]# stat -c %a /tmp
1777