grep和正则表达式

grep

作用：文本搜索工具，根据用户指定的“模式（过滤条件）”对目标文件逐行进行匹配检查；打印匹配到的行；

模式：由正则表达式的元字符及文本所编写出的过滤条件

语法：【选项】【文件】

参数：

–color=auto 高亮显示匹配到的字符串

-v 反向匹配（即不显示选项内的内容）

-i 忽略大小写

-n 显示的结果前增加行号

-c 仅显示匹配到结果的行数

-o 仅显示匹配到的字符串

-q 静默模式，不输出任何信息

(或者 &>
/dev/null)

-A# 显示关键字行及向后#行

-B# 显示关键字行及向前#行

-C# 显示关键字向前#行，当前行，及向后#行

-e 关键字1 -e 关键字2 实现多个选项间的逻辑or关系

-w 匹配整个单词

-E 使用扩展正则表达式或egrep

-F 不使用正则表达式或 fgrep

基本正则表达式元字符

作用：由一类特殊字符及文本字符所编写的模式，其中有些字符不表示其字面意义，而是用于表示控制或通配的功能。

字符匹配：

. 匹配任意单个字符

[ ] 匹配指定范围内的任意单个字符

[^] 匹配指定范围外的任意单个字符

[:alnum:] 或 [0-9a-zA-Z] 字母和数字

[:alpha:] 或 [a-zA-Z] 所有大小写字母

[:upper:] 或 [A-Z] 大写字母

[:lower:] 或 [a-z] 小写字母

[:blank:] 空白字符（空格和制表符）

[:space:] 水平和垂直的空白字符（比[:blank:]包含的范围广）

[:cntrl:] 不可打印的控制字符（退格、删除、警铃…）

[:digit:] 十进制数字或[0-9]

[:xdigit:]十六进制数字

[:graph:] 可打印的非空白字符

[:print:] 可打印字符

[:punct:] 标点符号

匹配次数：

* 匹配前面的字符任意次，包括0

.* 任意长度的任意字符

\? 匹配其前面的字符0或1次

\+ 匹配其前面的字符至少1次

\{n\} 匹配前面的字符n次

\{m,n\} 匹配前面的字符至少m次，最多n次

\{,n\} 匹配前面的字符最多n次

\{n,\} 匹配前面的字符至少n次

位置锚定：定位出现的位置

^ 行首锚定，用于模式的最左侧

$ 行尾锚定，用于模式的最右侧

^PATTERN$ 用于模式匹配整行

^$ 空行

^[[:space:]]*$ 空白行

^# 以#开头

\<或\b 词首锚定，用于单词模式的左侧

\>或\b 词尾锚定，用于单词模式的右侧

\<PATTERN\> 匹配整个单词

分组： 将一个或多个字符捆绑在一起，当作一个整体进行处理，如：$xy$*ab表示xy这个整体可以被匹配任意次

注意：分组括号中的模式匹配到的内容会被正则表达式引擎记录于内部的变量中，这些变量的命名方式为: \1, \2, \3, …

\1 表示从左侧起第一个左括号以及与之匹配右括号之间的模式所匹配到的字符

\2 表示从左侧起第二个左括号以及与之匹配右括号之间的模式所匹配到的字符

后向引用：引用前面的分组括号中的模式所匹配到的字符，而非模式本身。

实例：

1、显示/etc/passwd文件中不以/bin/bash结尾的行

grep -v “/bin/bash$”
/etc/passwd （-v忽略匹配到的字符串）

2、显示/proc/meminfo文件中以大写或小写S开头的行

此题有好几种解法：

grep “^[Ss]” /proc/meminfo （“^[Ss]”表示匹配以大写S或小写s开头的行）

grep -I “^s” /proc/meminfo （-I 表示忽略大小写）

grep -e ^s -e ^S /proc/meminfo （-e表示实现多个选项间的逻辑or关系）

grep “^s\|^S” /proc/meminfo （\|表示“或”）

3、显示用户rpc默认的shell程序

grep -w
“^rpc” /etc/passwd | cut -d : -f7（-w匹配整个单词）

4、找出“netstat -tan”命令的结果中以‘LISTEN’后跟任意多个空白字符结尾的行

netstat -tan|grep
“\<LISTEN\>[[:space:]]*$”（*表示匹配前面的字符任意次）

egrep

扩展正则表达式的元字符：

字符匹配：

. 任意单个字符

[ ] 指定范围的字符

[^] 不在指定范围的字符

次数匹配：

*：匹配前面字符任意次

?：0或1次

+：1次或多次

{m}：匹配m次

{,n}：匹配至多n次

{m,n}：至少m，至多n次

位置锚定：

^ ：行首

$ ：行尾

\<, \b ：语首

\>,
\b ：语尾

分组：

（）：用括号括起来表示要引用的内容，不需要转义

后向引用：\1,\2, \3…

或者：

a|b： a或b

C|cat： C或cat

(C|c)at：Cat或cat

实例：

1、利用扩展正则表达式分别表示0-9、10-99、100-199、200-249、250-255

echo {0..300}|egrep -o “\<[0-9]\>”（行首锚定\<；行尾锚定\>）

echo {0..300}|egrep -o “\<[1-9][0-9]\>”

echo {0..300}|egrep -o “\<1[0-9][0-9]\>”

echo {0..300}|egrep -o “\<2[0-4][0-9]\>”

echo {0..300}|egrep -o “\<25[0-5]\>”

因为中间显示的数字较长，所以开头和结尾为代表示意。

2、将此字符串：welcome to magedu linux 中的每个字符去重并排序，重复次数多的排到前面

echo “welcome to magedu linux”|grep -o . |sort|uniq -c
|sort –nr （ . 表示匹配任意单个字符）

3、使用egrep取出/etc/rc.d/init.d/functions中其基名

echo /etc/rc.d/init.d/functions |egrep -o “[^/]+/?$”

fgrep：不支持正则表达式元字符

当无需用到元字符去编写模式时，使用fgrep更好

今天要说的就这么多了，see you !

原创文章，作者：吼吼哈嘿，如若转载，请注明出处：http://www.178linux.com/83681

grep和正则表达式

相关推荐

二、(1)Linux常用文件管理类命令详解

学习了点命令

Linux文件系统及文件管理相关命令

Linux iptables配置应用

centos进程管理

Linux的发展史

分享到: