正则表达式及grep命令

2020-09-23 10:10:52 浏览数 (1)

笔记内容:

l 9.1 正则介绍_grep上

l 9.2 grep中

l 9.3 grep下

笔记日期:2017.8.17

9.1 正则介绍_grep上

正则就是各种各样的字符组合在一起形成的一串有规律的字符串,编程语言、shell脚本都需要用到正则表达式,可以利用正则来完成一些复杂的需求。

  学习正则需要用到四个工具grep、egrep、sed、awk,其中egrep是grep的扩展,这俩者通常被归类为同一个工具。学好正则对编写shell脚本有很大的帮助。

grep最简单的用法就是后面加一个字符串,然后匹配含有这个字符串的行:

在CentOS7中grep自带了--color=auto选项:

-c选项查看行数:

-n选项显示行号:

-i选项不区分大小写查看:

-v选项是取反:

-r选项把一些子目录下面的文件进行遍历:

把root目录下含有root字符串的文件都列出来了

-A选项后面跟数字就会列出指定字符所在行下的n行:

-B选项则是相反,列出指定字符所在行上的n行:

-C选项是列出指定字符所在行上下n行:

9.2 grep中

要注意的是所谓0-9不是说0到9的基数的意思,是指包含0-9的字符串,比如956包含了9、5、6这三个字符,就会被列出来。

  加-v选项就是显示不包含0-9的行,也可以理解为把不包含数字的行列出来:

^#表示列出以#号开头的行,所以^就是表示某个字符开头的行:

加-v选项就可以过滤掉#号开头的行:

[^0-9]表示非0-9,会把内容列出来然后0-9之外的字符都会显示颜色:

9.3 grep下

  . 表示匹配任意的单个字符的行:

* 则表示匹配任意个字符的行:

.* 贪婪匹配,会匹配所有的,类似于通配:

{}可以用数字指定前面那个字符的重复范围,但是要加上脱义符:

如果不想写脱义符可以加个-E选项或者使用egrep:

和*有点相似,表示匹配字符出现1次上的行,而*号则是0次也算,使用 需要加上脱义符,不想使用脱义符就用egrep:

?表示字符重复次数为0或1:

| 是或者的意思:

()是表示组合的意思:

扩展

把一个目录下,过滤所有*.php文档中含有eval的行

grep -r --include="*.php" 'eval' /data/

0 人点赞