Linux文本处理命令grep及正则表达式

一、grep

1、grep概述

（1）作用：grep是一文本搜索工具，根据用户指定的“模式”对目标文本逐行进行匹配检查；打印匹配到的行

（2）模式：由正则表达式字符及文本字符所编写的过滤条件

2、命令格式

grep [选项] 模式 [文件…]

案例:打印passwd文件中root用户的信息

3、grep选项

选项	功能
–color=auto	对匹配到的文本着色显示
-v	显示不被pattern匹配到的行
-i	忽略字符大小写
-n	显示匹配的行号，此处的行号时该内容在原文件中的行号
-c	统计匹配的行数
-o	仅显示匹配到的字符串
-q	静默模式，不输出任何信息
-A	输出满足条件的前几行，比如grep –B 3 “aa” file表示在file中输出有aa的行，同时还要输出aa的前三行
-B	输出满足条件的后几行
-C #	相当于同时用-A –B，即前后都输出
-e	实现多个选项间的逻辑or关系grep –e ‘cat ’ -e ‘dog’ file
-w	匹配整个单词
-E	相当于egrep 支持扩展的正则表达式
-F	相当于fgrep，不支持正则表达式

二、正则表达式

1、正则表达式及概述

（1）概述：由一类特殊字符及文本字符所编写的模式，用来在文件中匹配符合条件的字符串，其中有些字符（元字符）不表示字符字面意义，而表示控制或通配的功能。

（2）正则表达式Linux中支持的程序

grep,sed,awk,vim, less,nginx,varnish等

2、基本的正则表达式

（1）字符匹配:

（2）匹配次数：用在要指定次数的字符后面，用于指定前面的字符要出现的次数

（3）位置锚定：定位出现的位置

（4）分组：将一个或多个字符捆绑在一起，当作一个整体进行处理分组括号中的模式匹配到的内容会被正则表达式引擎记录于内部的变量中，这些变量的命名方式为: \1, \2, \3,

\1 :表示从左侧起第一个左括号以及与之匹配右括号之间的模式所匹配到的字符

示例：$string1\+\(string2$*\)

\1 ：string1\+(string2\)*

\2 ：string2

后向引用：引用前面的分组括号中的模式所匹配字符，而非模式本身

三、正则表达式及grep的使用案例

1、显示/proc/meminfo文件中以大小s开头的行

SwapCached: 12 kB

SwapTotal: 2097148 kB

或者grep -E “^(s|S)” /proc/meminfo

grep “^[Ss]” /proc/meminfo

2、显示/etc/passwd文件中不以/bin/bash结尾的行

3、显示用户lp默认的shell程序

或者cat /etc/passwd | grep “\<lp\>” | cut -d”:” -f7

4、找出/etc/passwd中的两位或三位数

或者：cat /etc/passwd | grep -o “\<[0-9]\{2,3\}\>”

5、显示CentOS7的/etc/grub2.cfg文件中，至少以一个空白字符开头的且后面存非空白字符的行

6、找出“netstat -tan”命令的结果中以‘LISTEN’后跟任意多个空白字符结尾的行

7、显示CentOS7上所有系统用户的用户名和UID

8、找出/etc/passwd用户名同shell名的行

或者 grep “^$[[:alnum:]]\+$:.*\1$” /etc/passwd

9、利用df和grep，取出磁盘各分区利用率，并从大到小排序

四、egrep及扩展正则表达式及使用案例

1、egrep的正则表达式及元字符