前言:
正则可以实现一些简单的功能,并用在脚本中,如检测ip地址是否符合规范,检测文件名是否符合规范等等。
正则表达式
正则表达式主要是用来描述一个句法规则的模式。其实说的通俗一点,就是利用字符和元字符的组合,对一些符合既定句法的模式进行模糊匹配。它的主要功能是文本查询和字符串操作。
正则表达式的基本元素包括普通字符和元字符,在Linux shell里面,常用的正则表达式元字符集为:S={* . ^ $ [] \ \<\> \{\} \{n,\} \{n,m\} },每一个元字符都有自己在正则表达式中的含义,下面来介绍一下:
“ * ”符号:表示匹配前面一个普通字符0次或多次。注意这里是一个普通字符,即如果是JO*B的话,那么*就匹配字符“O”任意次,而不是匹配“JO”串。
“ . ”符号:表示匹配任意一个字符。字符“ . "就表示一个字符,这个字符可以是任意字符。例如字符串 ...73 就表示前面3个字符为任意字符(包括空格),第4个和第5个字符分别是7和3。
“ ^ ”符号:表示匹配行首。例如:^cloud就表示匹配以cloud字符串开头的所有行。与上面匹配一个字符不一样,这里匹配的是后面跟着的整个字符串。
” $ "符号:表示匹配行尾。例如:cloud$ 就表示匹配以cloud字符串结尾的所有行。结合上面的匹配行首,^$表示匹配空行。
“ [] "符号:表示匹配方括号里面的字符集中的一个。例如:数字0-9中的任意一个数字都满足[0-9]这个表达式。值得注意的是,当^放在[]里面的时候,^就不再表示行首,而是表示取反。如:[^7-9]则表示非7-9中的任意一个数字才满足这个表达式。
” \ “符号:是转义字符。如果你写的正则表达式里面包括元字符,而你又想将它当做普通字符用的话,就要在前面加上转义符号" \ "了。例如:\$就表示一个普通字符”$"。
“\<\>"符号:表示精确匹配<>内的字符,” \ “是用来转义<>这两个字符的。例如:\<the\>表示匹配包含”the“的行,由于精确匹配,所以,”them“,”theory“这些单词所在的行并不会被匹配到。
”\{\}"符号:与" * "类似,表示匹配前面的一个字符任意多次。但是“\{\}”可以指定重复的次数,如\{3\}则表示重复前面的字符3次;\{3,\}表示重复前面的字符至少3次;\{3,5\}表示重复3到5次。例如:JO\{3\}B则表示重复字符O三次,即JOOOB;JO\{3,\}B则表示至少重复O三次,即JOOOB,JOOOOB等都符合;\{3,5\}则匹配JOOOB,JOOOOB,JOOOOOB这几个字符串。
通配符
初学的时候对于正则表达式和通配符的理解很模糊,两个都是可以进行模糊匹配的,到底什么时候用才是正则表达式,什么时候用是通配符呢?其实,我们登录系统之后,系统的bash shell并不支持正则表达式的,也就是说,我们如果使用bash shell的某些命令时使用正则表达式,shell可能会认不出来,只有当我们使用类似grep,sed,awk等工具的时候才有效。所以,我们在使用bash shell的时候也想达到模糊匹配的目的的话,就要使用通配符了。
通配符是使用正则表达式的一些元字符来的,常用的元字符集:E={"字符不再表示匹配前面一个字符任意多次,而是表示任意位置的任意字符。例如:phi*ip,则可以匹配philip,phillip,philsaip等开始三个是phi和结尾两位是ip的任意字符。例如ls -l *.awk表示匹配以.awk结尾的所有文件,*表示任意长度任意字符组合。
" " . "
" {} “字符不需要转义。在{}表示的是表达式集合。如:ls -l {[a-h]*.awk,0" ^ "字符也不是表示行首,而是代表取反。
正则表达式和通配的应用环境上有些不一样,但是都能够达到模糊匹配的效果。在后面介绍到的使用grep,sed和awk等工具对于文件的查找以及各种操作中,正则表达式的匹配作用更加明显。
范例:
检测文件名是否符合规范:
#!/bin/bash RED='\033[31m' GREEN='\033[32m' awk '{printf("%s",$0)}' $1 | egrep "^#[[:digit:]]*-(docs|unittest|pseudocode|msg-[^ ].*)$" > /dev/null 2>&1 if [ $"message check ${RED}fail${NORMAL}" exit 1 fi echo -e "message check ${GREEN}success${NORMAL}" exit 0
当然,也可以使用if,如:
if [[ $1 =~ ^[0-9]+$ ]]; then echo "Is Number." else echo "No Number." fi
检测ip地址是否符合规范:
构造测试文件 ip.txt
10.1.1.1 192.168.0.1 192.168.0.101 255.255.255.255 999.0.0.1 1.0.0.500 a.0.0.0 0.b.0.0 1.1.1 2.2 1 0.0.0.0
基本思路就是要每个点之间的元素为整数,最多为3位整数[0-9]\{1,3\},然后用 . 拼接起来,加上^和$更精确的限制匹配对象
cat ip.txt |grep '^[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}$'
结果为
10.1.1.1 192.168.0.1 192.168.0.101 255.255.255.255 999.0.0.1 1.0.0.500 0.0.0.0
这里精度不够,需要严格限制整数为1-255(第一个元素不能为0,后面的可以为0),即0-9 10-99 100-199 200-249 250-255
\([1-9]\|[1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]\)
注意|和()转义,另外|分割的元素要用()括住,若带-E参数指定为扩展正则的形式则不需用\转义
然后后面3个元素只要稍改下范围到0-255,简单的拼接起来
复制代码 代码如下:cat ip.txt |grep '^\([1-9]\|[1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]\)\.\([0-9]\|[1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]\)\.\([0-9]\|[1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]\)\.\([0-9]\|[1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]\)$'
结果如下
10.1.1.1
192.168.0.1
192.168.0.101
255.255.255.255
当然更简洁的写法,记得.后面的元要()括起来
复制代码 代码如下:cat ip.txt |grep '^\([1-9]\|[1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]\)\(\.\([0-9]\|([1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]\)\)\{3\}$'
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
P70系列延期,华为新旗舰将在下月发布
3月20日消息,近期博主@数码闲聊站 透露,原定三月份发布的华为新旗舰P70系列延期发布,预计4月份上市。
而博主@定焦数码 爆料,华为的P70系列在定位上已经超过了Mate60,成为了重要的旗舰系列之一。它肩负着重返影像领域顶尖的使命。那么这次P70会带来哪些令人惊艳的创新呢?
根据目前爆料的消息来看,华为P70系列将推出三个版本,其中P70和P70 Pro采用了三角形的摄像头模组设计,而P70 Art则采用了与上一代P60 Art相似的不规则形状设计。这样的外观是否好看见仁见智,但辨识度绝对拉满。
更新日志
- 小骆驼-《草原狼2(蓝光CD)》[原抓WAV+CUE]
- 群星《欢迎来到我身边 电影原声专辑》[320K/MP3][105.02MB]
- 群星《欢迎来到我身边 电影原声专辑》[FLAC/分轨][480.9MB]
- 雷婷《梦里蓝天HQⅡ》 2023头版限量编号低速原抓[WAV+CUE][463M]
- 群星《2024好听新歌42》AI调整音效【WAV分轨】
- 王思雨-《思念陪着鸿雁飞》WAV
- 王思雨《喜马拉雅HQ》头版限量编号[WAV+CUE]
- 李健《无时无刻》[WAV+CUE][590M]
- 陈奕迅《酝酿》[WAV分轨][502M]
- 卓依婷《化蝶》2CD[WAV+CUE][1.1G]
- 群星《吉他王(黑胶CD)》[WAV+CUE]
- 齐秦《穿乐(穿越)》[WAV+CUE]
- 发烧珍品《数位CD音响测试-动向效果(九)》【WAV+CUE】
- 邝美云《邝美云精装歌集》[DSF][1.6G]
- 吕方《爱一回伤一回》[WAV+CUE][454M]