正则表达式在Linux经常配合grep,sed和awk等用于搜寻关键字。正则表达式分为正则表达式和扩展正则表达式:
一、正则表达式
1.1 元字符:
.:匹配任意字符
[]:匹配[]中的任意一个字符
[^]:匹配[]以外的任意字符
[:alpha:]大小写英文字母
[:digit:]:十进制数字
[:xdigit:]:十六进制数字
[:upper:]:大写字母
[:lower:]:小写字母
[:space:]:空格
[:punct:]:标点符号
[:blank:]:空格和制表符(TAB)
[:alnum:]:所有字母和数字
[:print:]:可打印字符
[:graph:]:可打印的非空白字符
^:锚定行首
$:锚定行尾
^$:空行
^PATTERN$:锚定整行
^[[:space:]]$:空白行
\b PATTERN\b | \< PATTERN\>:匹配整个单词
\b | \<:词首锚定
\b | \>:词尾锚定
*:匹配其前面字符任意次,最少0次,最多不限
.*:匹配任意字符任意次
\{n,m\}:匹配其前面字符最少n次,最多m次
\{n\}:匹配其前面字符n次
\{n,\}:匹配其前面字符至少n次
\{,m\}:匹配其前面字符至多m次
\+:匹配其前面字符至少1次,至多无限次
\?:匹配其前面字符0次或1次,最多1次
1.4 分组
\(PATTERN\)\1 :\1表示和前面\(\)中的内容相同,引用前面的内容
1.5 或
|
a \| b:表示a或b
扩展正则表达式和基本正则表达式差别不大,一下为有差别的部分:
+:匹配其前面字符至少1次,至多无限次
?:匹配其前面字符0次或1次,最多1次
{n,m}:匹配其前面字符最少n次,最多m次
{n,}:匹配其前面字符至少n次
{,m}:匹配其前面字符至多m次
{n}:匹配其前面字符n次
三、grep命令:用于匹配关键字,支持正则表达式
grep [OPTIONS] PATTERN [FILE…]
常用参数:
-e:同时匹配多个结果,多个结果之间为并列的关系
-i:忽略大小写
-c:匹配统计的行数
-E:采用扩展正则表达式,相当于egrep
-o:只显示匹配到的结果
-n:显示行号
-v:取反
-C #:显示匹配结果上下#行
-A #:显示匹配结果下面#行
-B #:显示匹配结果上面#行
-w:匹配整个单词
-q:静默输出,常用在脚本中,取$?的值
四、例题:
1、显示三个用户root、mage、wang的UID和默认shell
cat /etc/passwd|egrep “^root|^mage|^wang”|cut -d: -f 1,3
2、找出/etc/rc.d/init.d/functions文件中行首为某单词(包括下划线)后面跟一个小括号的行
[root@localhost script]# cat /etc/rc.d/init.d/functions |egrep “^[_[:alpha:]]+\(\)”
3、使用egrep取出/etc/rc.d/init.d/functions中其基名
[root@localhost script]# echo “/etc/rc.d/init.d/function”|egrep -o “/[[:alpha:]]+$”|cut -d”/”
-f2
4、使用egrep取出上面路径的目录名
[root@localhost script]# echo “/etc/rc.d/init.d/function”|egrep -o “/.*/”
5、利用扩展正则表达式分别表示0-9、10-99、100-199、200-249、250-255
egrep “[0-9]{1}”
egrep “[0-9]{2}”
egrep “[0-9]{3}”
egrep “2[0-4]{1}[0-9]{1}”
egrep “25[0-5]{1}”
6、显示ifconfig命令结果中所有IPv4地址
ifconfig | egrep -o “([0-9]{1,3}\.){3}[0-9]{1,3}”
7、将此字符串:welcome to magedu linux 中的每个字符去重并排序,重复次数多的排到前面
[root@localhost script]# echo “welcome to magedu linux”|egrep -o “[[:alpha:]]”|sort|uniq -c|so
rt -rn
原创文章,作者:王子豪,如若转载,请注明出处:http://www.178linux.com/72773