3分钟短文 | grep 入门用法,匹配多字符串,多正则模式

2020-06-11 14:16:17 浏览数 (1)

引言

grep 是一种功能强大的命令行工具,可以在一个或多个输入文件中搜索与正则表达式匹配的行,并将每条匹配的行写入标准输出。

在本文中,我们将向你展示如何使用GNU grep搜索多个字符串或模式。

Grep多模式搜索

GNU grep支持三种正则表达式语法,Basic,Extended和Perl兼容。如果未指定正则表达式类型,grep则将搜索模式解释为基本正则表达式。

要搜索多个模式,请使用 OR(或)运算符。

或运算符|(管道符)可以指定不同的可能匹配项,这些匹配项可以是文字字符串或表达式集。在所有正则表达式运算符中,此运算符的优先级最低。

使用grep基本正则表达式搜索多个模式的语法如下:

代码语言:javascript复制
grep 'pattern1|pattern2' file...

始终将正则表达式括在单引号中,以避免shell解释和扩展元字符。

使用基本正则表达式时,元字符将解释为文字字符。为了保留元字符的特殊含义,必须使用反斜杠()将其转义。这就是为什么我们|用斜杠转义OR运算符的原因。

解释图案作为扩展正则表达式中,调用grep的-E(或--extended-regexp)选项。使用扩展正则表达式时,请不要转义|运算符:

代码语言:javascript复制
grep -E 'pattern1|pattern2' file...

Grep多个字符串

文字字符串是最基本的模式。

在下面的例子中,在 Nginx 日志错误文件内,查找包含单词 fatal,error以及critical的所有行:

代码语言:javascript复制
grep 'fatal|error|critical' /var/log/nginx/error.log

如果要搜索的字符串包含空格,请用双引号将其引起来。

这是使用扩展正则表达式的相同示例,从而消除了对运算符进行转义的需要:

代码语言:javascript复制
grep -E 'fatal|error|critical' /var/log/nginx/error.log

默认情况下,grep区分大小写。这意味着将大写和小写字符被视为不同的字符。

在搜索时,调用忽略大小写grep with的-i选项(或--ignore-case):

代码语言:javascript复制
grep -i 'fatal|error|critical' /var/log/nginx/error.log

搜索字符串时,grep将显示该字符串嵌入较大字符串中的所有行。因此,如果要搜索“error”,grep还将打印用较多的单词(例如“errors”,“errorless”,“antiterrorists”)。

要仅返回指定字符串为整个单词(用非单词字符括起来)的那些行,请使用-w(或--word-regexp)选项:

代码语言:javascript复制
grep -w 'fatal|error|critical' /var/log/nginx/error.log

文字字符包括字母数字字符(az,AZ和0-9)和下划线(_)。所有其他字符均视为非单词字符。

写在最后

上面两节实例,我们着重说了 grep 的多个搜索字符串,和多个匹配模式的基本用法,使用的时候一定要注意 | 是否转义。

0 人点赞