引言
grep 是一种功能强大的命令行工具,可以在一个或多个输入文件中搜索与正则表达式匹配的行,并将每条匹配的行写入标准输出。
在本文中,我们将向你展示如何使用GNU grep搜索多个字符串或模式。
Grep多模式搜索
GNU grep支持三种正则表达式语法,Basic,Extended和Perl兼容。如果未指定正则表达式类型,grep则将搜索模式解释为基本正则表达式。
要搜索多个模式,请使用 OR(或)运算符。
或运算符|(管道符)可以指定不同的可能匹配项,这些匹配项可以是文字字符串或表达式集。在所有正则表达式运算符中,此运算符的优先级最低。
使用grep基本正则表达式搜索多个模式的语法如下:
代码语言:javascript复制grep 'pattern1|pattern2' file...
始终将正则表达式括在单引号中,以避免shell解释和扩展元字符。
使用基本正则表达式时,元字符将解释为文字字符。为了保留元字符的特殊含义,必须使用反斜杠()将其转义。这就是为什么我们|用斜杠转义OR运算符的原因。
解释图案作为扩展正则表达式中,调用grep的-E(或--extended-regexp)选项。使用扩展正则表达式时,请不要转义|运算符:
代码语言:javascript复制grep -E 'pattern1|pattern2' file...
Grep多个字符串
文字字符串是最基本的模式。
在下面的例子中,在 Nginx 日志错误文件内,查找包含单词 fatal,error以及critical的所有行:
代码语言:javascript复制grep 'fatal|error|critical' /var/log/nginx/error.log
如果要搜索的字符串包含空格,请用双引号将其引起来。
这是使用扩展正则表达式的相同示例,从而消除了对运算符进行转义的需要:
代码语言:javascript复制grep -E 'fatal|error|critical' /var/log/nginx/error.log
默认情况下,grep区分大小写。这意味着将大写和小写字符被视为不同的字符。
在搜索时,调用忽略大小写grep with的-i选项(或--ignore-case):
代码语言:javascript复制grep -i 'fatal|error|critical' /var/log/nginx/error.log
搜索字符串时,grep将显示该字符串嵌入较大字符串中的所有行。因此,如果要搜索“error”,grep还将打印用较多的单词(例如“errors”,“errorless”,“antiterrorists”)。
要仅返回指定字符串为整个单词(用非单词字符括起来)的那些行,请使用-w(或--word-regexp)选项:
代码语言:javascript复制grep -w 'fatal|error|critical' /var/log/nginx/error.log
文字字符包括字母数字字符(az,AZ和0-9)和下划线(_)。所有其他字符均视为非单词字符。
写在最后
上面两节实例,我们着重说了 grep 的多个搜索字符串,和多个匹配模式的基本用法,使用的时候一定要注意 | 是否转义。