Linux文本搜索工具grep

Linux文本搜索工具grep



简介

grep(全称Globally search a Regular Expression and Print,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,根据用户指定的“模式(pattern)”对目标文本进行匹配检查,打印匹配到的行。

 家族成员: 
  grep:支持基本正则表达式 
  egrep:相当于grep -E,支持扩展正则表达式 
  fgrep:相当于grep -F,不支持正则表达式


主要参数及使用

grep

格式: grep [OPTIONS] PATTERN [FILE…]

常用选项: 
–color=auto:对匹配的文本着色显示 
注: CentOS 7默认设置该参数。

-v:显示不能被pattern匹配到的行

# cat test
how are you?
hellow
# grep -v are test
hellow

提示:如test文件内容发生改变,会用cat命令将其展示,反之则表示内容不变

-i:忽略字符大小写

# cat test
how are you?
HOW ARE YOU?
# grep are test
how are you?
# grep ARE test
HOW ARE YOU?
# grep -i are test
how are you?
HOW ARE YOU?

-o:仅显示匹配到的字符串

# cat test
how are you?
# grep -o are test
are

-q:静默模式,不输出任何信息 
 静默模式下不会输出任何信息,命令的执行结果可以通过echo $?查询。

# cat test
name
# grep -q name test
# echo $?
0
# grep -q what test
# echo $?
1

-A #:显示匹配的后#行信息

# cat test
how are you?
HOW ARE YOU?
hello
# grep -A 1 ARE test
HOW ARE YOU?
hello

-B #:显示匹配的前#行信息

# grep -B 1 ARE test
how are you?
HOW ARE YOU?

-C #:显示匹配的前后各#行信息

# grep -C 1 ARE test
how are you?
HOW ARE YOU?
hello

基本正则表达式

正则表达式由普通字符和元字符组成。普通字符包括大小写字母和数字,而元字符则具有特殊意义,接下来将对元字符进行介绍。

  • 字符匹配:

.:匹配任意单个字符 
Linux文本搜索工具grep

[]:匹配指定范围内任意单个字符 
Linux文本搜索工具grep

[^]:匹配指定范围外任意单个字符 
Linux文本搜索工具grep 
专用字符集合: 
[:digit:]:任意数字,相当于0-9 
[:lower:]:任意小写字母 
[:upper:]:任意大写字母 
[:alpha:]:任意大小写字母 
[:alnum:]:任意数字或字母 
[:space:]:空格 
[:punct:]:标点符号

  • 匹配次数: 
    用在要指定次数的字符后面,用于指定前面的字符要出现的次数

*:匹配前面字符任意次 
Linux文本搜索工具grep 
注:a*c筛选的是含有c的行,a*是指a可以出现任意次也可没有。

.*:匹配任意长度的任意字符(.为任意字符 *为任意次数) 
Linux文本搜索工具grep

\?:匹配其前面的字符0或1次,即前面的可有可无 
Linux文本搜索工具grep

\+:匹配其前面的字符至少1次 
Linux文本搜索工具grep

\{m\}:匹配前面的字符m次 
Linux文本搜索工具grep

\{m,n\}:匹配前面的字符至少m次,至多n次 
Linux文本搜索工具grep 
\{0,n\}:匹配前面的字符至多n次 
\{m,\}:匹配前面的字符至少m次

  • 位置锚定:

^:行首锚定,用于模式的最左侧 
Linux文本搜索工具grep

$:行尾锚定,用于模式的最右侧 
Linux文本搜索工具grep

^PATTERN$:用模式匹配整行 
Linux文本搜索工具grep

^$:匹配空行,主要配合-v取反消除空行

^[[:space:]]*$:在^$匹配不到的时候使用

\<\b:词首锚定,用于单词模式的左侧 
Linux文本搜索工具grep

\>\b:词尾锚定,用于单词模式的右侧 
Linux文本搜索工具grep

\<PATTERN\>:匹配整个单词 
Linux文本搜索工具grep

  • 分组:

\(\):将一个或多个字符捆绑在一起,当作一个整体进行处理 
Linux文本搜索工具grep

当我们想后续内容与前面模式匹配到的一样,则需要使用到引用也称后向引用。 
后向引用:引用前面的分组括号中的模式所匹配字符,而非模式本身 
Linux文本搜索工具grep

注:分组括号中的模式匹配到的内容会被正则表达式引擎记录于内部的变量中,这些变量的命名方式为: \1, \2, \3, … 
\1: 从左侧起,第一个左括号以及与之匹配右括号之间的模式所匹配到的字符 
例: (ab+(xy)*) 
  \1: ab+(xy)* 
  \2: xy


egrep

egrep=grep -E 
格式:egrep [OPTIONS] PATTERN [FILE…] 
常用选项与grep相同

扩展正则表达式

相对于基本正则表达式而言扩展正则表达式在某些参数上可以不使用转义符(\),在使用方式上并没有区别

接下来将介绍扩展正则表达式与基本正则表达式不同的地方,相同点不再累述

  • 次数匹配

?:匹配其前面的字符0或1次,即前面的可有可无 
+:匹配其前面的字符至少1次 
{m}:匹配前面的字符m次 
{m,n}:匹配前面的字符至少m次,至多n次

  • 分组

():将一个或多个字符捆绑在一起,当作一个整体进行处理

  • 或者

基本正则表达式可以使用\|代表或者 

a|b:a或者b 
C|cat:C或cat 
(C|c)at:Cat或cat


fgrep

fgrep不支持正则表达式,表达式仅作普通字符处理

fgrep=grep -F

原创文章,作者:Net18-海滨,如若转载,请注明出处:http://www.178linux.com/13872

(0)
Net18-海滨Net18-海滨
上一篇 2016-04-05
下一篇 2016-04-05

相关推荐

  • DNS

    这里都以我本机的实验为例 正向解析:就是从主机名到IP的解析过程 先在工作目录/var/named/创建一个区域数据文件 以zcylinux.io域为例:vim/var/named/zcylinux.io.zone $TTL  600     #设置全局变量TTL的值为600s zcylinux.io.&nb…

    Linux干货 2017-05-30
  • 德摩根定律

     德摩根定律: 非(P且Q) = (非P) 或 (非Q) 非(P或Q) = (非P) 且 (非Q) 德·摩根定律在数理逻辑的定理推演中,在计算机的逻辑设计中以及数学的集合运算中都起着重要的作用。他的发现影响了乔治·布尔从事的逻辑问题代数解法的研究。这巩固了德摩根作为该规律的发现者的地位,尽管亚里士多德也曾注意到类似现象,且这也为古希腊与中世纪的逻辑…

    Linux干货 2016-08-15
  • 逻辑卷管理

    逻辑卷管理 一 创建逻辑卷 1 准备分区或硬盘 这里使用/dev/sdb、/dev/sdc两块硬盘和/dev/sda9、/dev/sda10两个分区,大小都为1G,磁盘有限,我也不想这么抠的。 添加分区/dev/sda9、 /dev/sda10 [root@centos7 ~]# fdisk /dev/sda Welcome to fdisk (u…

    Linux干货 2017-05-02
  • 一个PHP程序员学习运维的转型

         我是一位PHP开发工程师,平时负责前端、后端以及服务器端的工作,但是称不上是个牛逼的程序员。网上热烈讨论一则传闻,“全栈工程师”(Full Stack Engineer),要求应征者对开发堆栈的每个方面都有所掌握。那究竟何为 “全栈工程师”呢?从字面上来理解,全栈工程师必须熟悉开发堆栈的每一个层次,或者至少熟悉绝大多数…

    Linux干货 2017-04-02
  • httpd服务归纳:httpd基本配置(配置文件格式以及常用选项)

    一、 httpd文件的基本格式 主配置文件位置, /etc/httpd/conf/httpd.conf    1. 配置文件参数格式  配置参数    值       特点:    &nbs…

    Linux干货 2015-05-13
  • 循环的特殊用法及函数

    while特殊用法 while read 变量名;do 循环体 done<文件路径(将文件中的每一行依次读入循环体,赋值给变量)   (())可以实现C语言风格的变量操作 for循环特殊格式 for((控制变量初始化;条件判断表达式;控制变量修正表达式)) do 循环体 done 控制变量初始化仅在循环开始时执行一次,进行条件判断成立后执行循…

    Linux干货 2016-08-21

评论列表(3条)

  • stanley
    stanley 2016-04-05 22:57

    赞。详细有料

  • twoyang
    twoyang 2016-04-07 20:45

    基本正则表达式是支持\|的。

  • Net18-海滨
    Net18-海滨 2016-04-08 12:07

    修正:基本正则表达式可使用\|来代表或者,并非不支持,感谢twoyang提醒。