Bash 中的正则表达式匹配
本教程演示了使用 bash 中的重新匹配运算符进行正则表达式匹配。
Bash 中的重新匹配运算符
=~
运算符称为重新匹配运算符。它使用以下语法。
[[ string =~ regex ]]
重新匹配运算符对其从左到右的字符串执行正则表达式匹配。如果左侧与右侧匹配,则运算符返回 0
,否则返回 1
。
在 Bash 中匹配数字
下面的脚本检查变量 $greet
是否包含右侧提到的字符,在我们的例子中是数字。如果存在完全匹配,则重新匹配运算符返回 0
,并且脚本会打印出正确的输出。
greet="Hello,World!"
if [[ $greet =~ [0-9] ]]; then
printf "$greet is a number\n"
else
printf "$greet is not a number\n"
fi
由于 $greet
变量的值只有数字以外的字符,因此重新匹配运算符返回 1
并打印以下输出。
Hello,World! is not a number
在这里,我们在脚本中创建了一个新变量,该变量只有名为 num
的数字。然后我们检查 num
变量是否只有数字,并根据重新匹配运算符返回的值打印相应的输出。
#!/bin/env bash
num="2021"
if [[ $num =~ [0-9] ]]; then
printf "$num is a number\n"
else
printf "$num is not a number\n"
fi
由于变量 num
只有数字,重新匹配运算符返回 0
,脚本打印下面的语句。
2021 is a number
正则表达式匹配 Bash 中字符串的开头
下面的脚本检查 $greet
变量中的值是否以数字开头。^
用于指定匹配字符串开头的字符。根据运算符返回的值,我们打印相应的输出。
#!/bin/env bash
greet="123Hello,World!"
if [[ $greet =~ ^[0-9] ]]; then
printf "$greet starts with a digit(s).\n"
else
printf "$greet does not start with a digit(s)\n"
fi
由于 $greet
变量中的值以数字开头,因此运算符返回 0
,并在下面打印输出。
123Hello,World! starts with a digit(s).
让我们将 $greet
设置为一个新值,如下所示并运行脚本。
#!/bin/env bash
greet="Hello,World!123"
if [[ $greet =~ ^[0-9] ]]; then
printf "$greet starts with a digit(s).\n"
else
printf "$greet does not start with a digit(s)\n"
fi
bash 运算符将返回 1
,因为变量 $greet
中的字符串不以数字开头。该脚本将打印如下所示的输出。
Hello,World!123 does not start with a digit(s)
正则表达式匹配 Bash 中字符串的结尾
下面的脚本检查 $greet
变量中的值是否以数字结尾。$
用于指定匹配字符串末尾的字符。
要打印的输出将取决于重新匹配运算符返回的值。
#!/bin/env bash
greet="Hello,World!123"
if [[ $greet =~ [0-9]$ ]]; then
printf "$greet ends with a digit(s).\n"
else
printf "$greet does not end with a digit(s)\n"
fi
$greet
变量中的字符串值以数字结尾。重新匹配运算符返回 0
,脚本会在下面打印输出。
Hello,World!123 ends with a digit(s).
让我们更改 $greet
变量的值,如下面的脚本所示。
#!/bin/env bash
greet="123Hello,World!"
if [[ $greet =~ [0-9]$ ]]; then
printf "$greet ends with a digit(s).\n"
else
printf "$greet does not end with a digit(s)\n"
fi
由于变量 $greet
中的字符串不以一个或多个数字结尾,重新匹配运算符返回 1
,并且脚本会在下面打印输出。
123Hello,World! does not end with a digit(s)
Bash 中的正则表达式匹配电子邮件
要匹配电子邮件,这个 ^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,4}$
通常使用正则表达式模式。
#!/bin/env bash
email="example@delftstack.com"
if [[ $email =~ ^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,4}$ ]]; then
printf "$email is a valid email.\n"
else
printf "$email is not a valid email.\n"
fi
下面的输出显示了一封已检查并已通过检查的电子邮件。
example@delftstack.com is a valid email.
让我们删除电子邮件末尾的 .com
,如下所示并运行脚本。
#!/bin/env bash
email="example@delftstack"
if [[ $email =~ ^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,4}$ ]]; then
printf "$email is a valid email.\n"
else
printf "$email is not a valid email.\n"
fi
电子邮件未通过测试,因为它没有最后一部分 .com
。
example@delftstack is not a valid email.