引言
Bash 是 Linux 系统下钦定的 shell。你可以通过
代码语言:javascript复制cat /etc/shells
查看当前系统支持的 shell 种类。
Bash 不但是系统管理员与内核交互的利器,且是一种语言,可以编写大多数系统的自动化脚本,用于简化运维工作。
今天我们学习一个知识点:如何在 Bash 中判断某个字符串中,是否包含子字符串?
题外话
在高级编程语言中,一般都提供了该功能,比如 PHP 使用函数 strpos 查找子字符串首次出现的位置,有则返回 integer 整型,没有则返回 false。
代码语言:javascript复制strpos ( string $haystack , mixed $needle [, int $offset = 0 ] ) : int
在 MySQL 中也经常使用字符串匹配,比如通配符 %,还可以使用函数 instr 来实现。
代码语言:javascript复制SELECT INSTR("abcd",'f');
问题的提出
一位开发者在编写 Bash 脚本的过程中,遇到一个问题。首先是有这样一个赋值操作:
代码语言:javascript复制string="My string"
然后他判断是否存在某个子字符串:
代码语言:javascript复制if [ $string ?? 'foo' ]; then
echo "It's there!"
fi
他这里打的 ?? 是占位符号,不知道该怎么写。甚至有了一种丑陋的写法:
代码语言:javascript复制if echo "$string" | grep 'foo'; then
echo "It's there!"
fi
这样的实现是不是 low 太多了?
解决方法
能用一行解决的问题,何必 BB!
一位开发者给出的方案是,如果判断条件上使用了双中括号,那么就可以这样写:
代码语言:javascript复制string='My long string'
if [[ $string == *"My long"* ]]; then
echo "It's there!"
fi
注意,是将子字符串外部使用双*号包裹。
其中 == 是字符串相等的比较符。而 * 则是通配符,会适配任意长度的任意字符。
强大的正则
我们知道,Bash 中的数据类型是极为弱的,不像高级语言那样区分 integer, string, float, double, array, Object 等等。在 Bash 看来,万物都是字符串。这与 Unix 的“一切皆文件”哲学不谋而合。
处理字符串,我们必然绕不开“正则表达式”。
上述的问题,有没有可能使用强大的正则方式处理呢?答案是肯定的。
比如这样写:
代码语言:javascript复制string='My string';
if [[ $string =~ "My" ]]
then
echo "It's there!"
fi
注意我们使用了 =~ 用于正则匹配,而不是逻辑运算符了。
正如上面所述,Bash 中如果使数字的比较,也完全可以使用字符串的正则方式处理。
比如要判断某个整数值,是否在某个有效的列表内。可以这样写。
代码语言:javascript复制number=3
if [[ "1,3,5,6,9" =~ "${number}" ]]; then
echo "Yes"
fi
用起来是不是精简多了。
知识延伸
像问题中使用 grep 用于子字符串筛选的那样,其实有更稳固的写法:
代码语言:javascript复制if grep -q foo <<<"$string"; then
echo "It's there"
fi
一般不使用 echo 后使用管道符 grep。
写在最后
在命令行中敲一下测试测试吧。只有多实践才能加深印象。
另外,正则表达式是真的强!
Happy coding :_)