编程小短文:Bash子字符串还在用==?试试=~,性能瞬间飙升100倍!

2020-05-29 16:19:34 浏览数 (1)

引言

Bash 是 Linux 系统下钦定的 shell。你可以通过

代码语言:javascript复制
cat /etc/shells

查看当前系统支持的 shell 种类。

Bash 不但是系统管理员与内核交互的利器,且是一种语言,可以编写大多数系统的自动化脚本,用于简化运维工作。

今天我们学习一个知识点:如何在 Bash 中判断某个字符串中,是否包含子字符串?

题外话

在高级编程语言中,一般都提供了该功能,比如 PHP 使用函数 strpos 查找子字符串首次出现的位置,有则返回 integer 整型,没有则返回 false。

代码语言:javascript复制
strpos ( string $haystack , mixed $needle [, int $offset = 0 ] ) : int

在 MySQL 中也经常使用字符串匹配,比如通配符 %,还可以使用函数 instr 来实现。

代码语言:javascript复制
SELECT INSTR("abcd",'f');

问题的提出

一位开发者在编写 Bash 脚本的过程中,遇到一个问题。首先是有这样一个赋值操作:

代码语言:javascript复制
string="My string"

然后他判断是否存在某个子字符串:

代码语言:javascript复制
if [ $string ?? 'foo' ]; then
  echo "It's there!"
fi

他这里打的 ?? 是占位符号,不知道该怎么写。甚至有了一种丑陋的写法:

代码语言:javascript复制
if echo "$string" | grep 'foo'; then
  echo "It's there!"
fi

这样的实现是不是 low 太多了?

解决方法

能用一行解决的问题,何必 BB!

一位开发者给出的方案是,如果判断条件上使用了双中括号,那么就可以这样写:

代码语言:javascript复制
string='My long string'
if [[ $string == *"My long"* ]]; then
  echo "It's there!"
fi

注意,是将子字符串外部使用双*号包裹。

其中 == 是字符串相等的比较符。而 * 则是通配符,会适配任意长度的任意字符。

强大的正则

我们知道,Bash 中的数据类型是极为弱的,不像高级语言那样区分 integer, string, float, double, array, Object 等等。在 Bash 看来,万物都是字符串。这与 Unix 的“一切皆文件”哲学不谋而合。

处理字符串,我们必然绕不开“正则表达式”。

上述的问题,有没有可能使用强大的正则方式处理呢?答案是肯定的。

比如这样写:

代码语言:javascript复制
string='My string';

if [[ $string =~ "My" ]]
then
   echo "It's there!"
fi

注意我们使用了 =~ 用于正则匹配,而不是逻辑运算符了。

正如上面所述,Bash 中如果使数字的比较,也完全可以使用字符串的正则方式处理。

比如要判断某个整数值,是否在某个有效的列表内。可以这样写。

代码语言:javascript复制
number=3
if [[ "1,3,5,6,9" =~ "${number}" ]]; then
    echo "Yes"
fi

用起来是不是精简多了。

知识延伸

像问题中使用 grep 用于子字符串筛选的那样,其实有更稳固的写法:

代码语言:javascript复制
if grep -q foo <<<"$string"; then
    echo "It's there"
fi

一般不使用 echo 后使用管道符 grep。

写在最后

在命令行中敲一下测试测试吧。只有多实践才能加深印象。

另外,正则表达式是真的强!

Happy coding :_)

0 人点赞