(27)正则表达式

2020-09-02 09:24:25 浏览数 (1)

想和我一起交流沟通,获取更多内容欢迎关注微信公众号:生信real

一、正则表达式与通配符

①正则表达式用来在文件中匹配符合条件的字符串,正则是包含匹配。grep、awk、sed等命令可以支持正则表达式。

②通配符用来匹配符合条件的文件名,通配符是完全匹配。ls、find、cp这些命令不支持正则表达式,所以只能使用shell自己的通配符来进行匹配了。

PS:包含匹配,用正则表达式(用grep、awk、sed命令)的时候,你搜索的内容只要包含在这文件行当中,他就会提取出这一行;完全匹配则是搜索内容和匹配内容一模一样,才能搜索出来。

二、基础正则表达式

元字符

作用

*

前一个字符匹配0次或任意多次。

.

匹配除了换行符外任意一个字符。

^

匹配行首。例如:^hello会匹配以hello开头的行。

$

匹配行尾。例如:hello&会匹配以hello结尾的行。

[]

匹配中括号中指定的任意一个字符,只匹配一个字符。例如:[aoeiu] 匹配任意一个元音字母,[0-9] 匹配任意一位数字,[a-z][0-9] 匹配小写字和一位数字构成的两位字符。

[^]

匹配除中括号的字符以外的任意一个字符。例如:[^0-9] 匹配任意一位非数字字符,[^a-z] 表示任意一位非小写字母。

转义符。用于取消特殊符号的含义取消。

{n}

表示其前面的字符恰好出现n次。例如:[0-9]{4}匹配4位数字,[1][3-8][0-9]{9}匹配11位数字。

{n,}

表示其前面的字符出现不小于n次。例如:[0-9]{2,}表示两位及以上的数字。

{n,m}

表示其前面的字符至少出现n次,最多出现m次。例如:[a-z]{6,8}匹配6到8位的小写字母。

举例之前回顾一下grep命令

代码语言:javascript复制
grep [选项] “搜索内容”
选项:-i  忽略大小写
      -n  输出行号
      -v  去掉-v后面查找的内容
      --color=auto 搜索出的关键字用颜色显示

接一下我们看一下举例的文件内容,这些内容故意写了一些错别字,加了一些特殊符号,空白行。

例1:"*"前一个字符匹配0次或任意多次。

①:匹配所有内容,包括空白行

②匹配至少包含一个a的行

③匹配至少包含两个连续a的字符串

例2:"."匹配除了换行符外任意一个字符。

①匹配在s和d这两个字母之间一定有两个字符的单词

②匹配在s和d字母之间有任意字符

③匹配所有内容

例3.^匹配行首,$匹配行尾

①匹配以小写x开头的行

②匹配以:结尾的行

③匹配空白行

例4:"[]"匹配中括号中指定的任意一个字符,只匹配一个字符。

①匹配s和i字母中,要不是a、要不是o

②匹配任意一个数字

例5:"[^]"匹配除中括号的字符以外的任意一个字符

①匹配不用小写字母开头的行

②匹配不用字母开头的行

例6:""转义符

①匹配使用"."结尾的行

例7:"{n}"表示其前面的字符恰好出现n次

①匹配a字母连续出现三次的字符串

例8:"{n,}"表示其前面的字符出现不小于n次

①匹配最少用连续三个数字开头的行

例9:“{n,m}”匹配其前面的字符至少出现n次, 最多出现m次

①匹配在字母s和字母i之间有最少一个a,最多三个a

END

0 人点赞