想和我一起交流沟通,获取更多内容欢迎关注微信公众号:生信real
一、正则表达式与通配符
①正则表达式用来在文件中匹配符合条件的字符串,正则是包含匹配。grep、awk、sed等命令可以支持正则表达式。
②通配符用来匹配符合条件的文件名,通配符是完全匹配。ls、find、cp这些命令不支持正则表达式,所以只能使用shell自己的通配符来进行匹配了。
PS:包含匹配,用正则表达式(用grep、awk、sed命令)的时候,你搜索的内容只要包含在这文件行当中,他就会提取出这一行;完全匹配则是搜索内容和匹配内容一模一样,才能搜索出来。
二、基础正则表达式
元字符 | 作用 |
---|---|
* | 前一个字符匹配0次或任意多次。 |
. | 匹配除了换行符外任意一个字符。 |
^ | 匹配行首。例如:^hello会匹配以hello开头的行。 |
$ | 匹配行尾。例如:hello&会匹配以hello结尾的行。 |
[] | 匹配中括号中指定的任意一个字符,只匹配一个字符。例如:[aoeiu] 匹配任意一个元音字母,[0-9] 匹配任意一位数字,[a-z][0-9] 匹配小写字和一位数字构成的两位字符。 |
[^] | 匹配除中括号的字符以外的任意一个字符。例如:[^0-9] 匹配任意一位非数字字符,[^a-z] 表示任意一位非小写字母。 |
转义符。用于取消特殊符号的含义取消。 | |
{n} | 表示其前面的字符恰好出现n次。例如:[0-9]{4}匹配4位数字,[1][3-8][0-9]{9}匹配11位数字。 |
{n,} | 表示其前面的字符出现不小于n次。例如:[0-9]{2,}表示两位及以上的数字。 |
{n,m} | 表示其前面的字符至少出现n次,最多出现m次。例如:[a-z]{6,8}匹配6到8位的小写字母。 |
举例之前回顾一下grep命令
代码语言:javascript复制grep [选项] “搜索内容”
选项:-i 忽略大小写
-n 输出行号
-v 去掉-v后面查找的内容
--color=auto 搜索出的关键字用颜色显示
接一下我们看一下举例的文件内容,这些内容故意写了一些错别字,加了一些特殊符号,空白行。
例1:"*"前一个字符匹配0次或任意多次。
①:匹配所有内容,包括空白行
②匹配至少包含一个a的行
③匹配至少包含两个连续a的字符串
例2:"."匹配除了换行符外任意一个字符。
①匹配在s和d这两个字母之间一定有两个字符的单词
②匹配在s和d字母之间有任意字符
③匹配所有内容
例3.^匹配行首,$匹配行尾
①匹配以小写x开头的行
②匹配以:结尾的行
③匹配空白行
例4:"[]"匹配中括号中指定的任意一个字符,只匹配一个字符。
①匹配s和i字母中,要不是a、要不是o
②匹配任意一个数字
例5:"[^]"匹配除中括号的字符以外的任意一个字符
①匹配不用小写字母开头的行
②匹配不用字母开头的行
例6:""转义符
①匹配使用"."结尾的行
例7:"{n}"表示其前面的字符恰好出现n次
①匹配a字母连续出现三次的字符串
例8:"{n,}"表示其前面的字符出现不小于n次
①匹配最少用连续三个数字开头的行
例9:“{n,m}”匹配其前面的字符至少出现n次, 最多出现m次
①匹配在字母s和字母i之间有最少一个a,最多三个a
END