如何使用正则表达式

正则表达式(Regular Expression)就是使用简单的字符按照预先设定的规则来完成复杂的功能,说白了,正则表达式是一种字符串的匹配方式,就是用预先设定好的规则来描述我们想要表达的内容,它是由普通字符以及元字符组成的字符串,其中元字符不表示本身的意义,而是用于表达控制或通配等功能。

为什么要用这个东西那,我想,每一个学习计算机的人都应该明白,计算机就是我们用数字来描述这个现实的世界,而如何使用数字来描述这个现实世界那,就必须用到字符,正则表达式之所以无比重要就是因为可以通过它来找到我们想要的东西,我们知道,对于linux系统管理来说,最重要的工作就是通过修改配置文件来实现系统管理工作的,而面对浩瀚的配置文件,如何能找到我们想要修改的内容那,有了正则表达式,就会大大减轻我们的工作量,下面就让我介绍一下linux文本搜索工具。

Linux下的文本搜索工具主要就三个:grepegrepfgrep;这三个工具主要功能就是根据用户指定的文本模式,这个文本模式是由正则表达式元字符以及正常字符组合而成,对目标文件进行逐行搜索,然后显示能匹配到的行。

grep命令使用方法:

    grep  [OPTION]  PATTERN   [FILE ….]

重要选项介绍:

    –color:用来指定匹配内容的颜色,主要参数有:auto alwaysnever

例如:grep  –color=auto  “root”  /etc/passwd

color.png

       -v :反向显示

       -o :只显示能匹配到的内容而不显示能匹配到这一行的其他内容

       -i : 搜索时不区分大小写

       -E:使用扩展的正则表达式

       -A#:被模式匹配到的行的下#行也一起显示

   -B#:被模式匹配到的行的前#行也一起显示

   -C#:被模式匹配到的行的前后#行也一起显示

 

以上就是grep命令的常用常见,接下来我们详细介绍grep搜索的模式,也就是正则表达式

  1. 字符匹配

              .  :匹配任意的单个字符

              [ ] :匹配指定范围内的任意单个字符

              [[:digit:]][0-9]:表示0-9范围内任意单个数字

              [[:lower:]][a-z]表示a-z范围内任意单个字母

              [[:upper:]][A-Z]:表示A-Z范围内任意单个字母

              [[:alnum:]][0-9a-zA-Z]:表示任意大小写字母或数字

              [[:alpha:]][a-zA-Z]:表示任意大小写字母

              [[:space:]]表示任意空格

              [^] :表示匹配制定范围外的任意单个字符

  2、次数匹配:在期望匹配字符的后面提供一个控制符,用来表达匹配其前面字符指定的次数。

*    :表示任意长度,0次、1次、或多次

\?   :匹配其前面的字符可以1次或0次,也就是说前面字符可有可无

\+   :1次或多次,表示左侧字符至少出现一次

\{n\}   :n次表示其左侧字符精确出现n

\{m,n\}  :至少m次,至多n

\{0,n\}   :至多n

\{m,0\}   :至多m

 3、位置锚定

                ^  :用来锚定行首

                $  :用来锚定行尾

 4、单词锚定:有非特殊字符组成的连续字符串

                \<\b  :锚定词首

                \>\b  :锚定词尾

                 \<PATTERN\>   :匹配PATTERN能匹配到的整个单词

 5、分组:在分组中的模式在某次具体的匹配过程中所匹配的字符,可以被grep记忆,保存于内置的变量中,这些变量是(\1\2…..\9)因此还可以被用来引用,其中(\1)用来引用自左而右由第一个左括号以及与之对应的右括号中模式所匹配到的内容,其中(\2)用来引用自左而右由第二个左括号以及与之对应的右括号中模式所匹配到的内容;

例如创建一下文本文件

QQ截图20151024142601.png

使用使用\1引用前一个模式总所匹配到的内容

QQ截图20151024142646.png

 

 

 接下来我们详细介绍egrep搜索的模式,也就是扩展正则表达式

    egrep命令使用方法:

    egrep  [OPTION]  PATTERN   [FILE ….]

 

 1、字符匹配

             .  :匹配任意的单个字符

             [ ] :匹配指定范围内的任意单个字符

             [[:digit:]][0-9]:表示0-9范围内任意单个数字

             [[:lower:]][a-z]:表示a-z范围内任意单个字母

            [[:upper:]][A-Z]:表示A-Z范围内任意单个字母

            [[:alnum:]][0-9a-zA-Z]:表示任意大小写字母或数字

            [[:alpha:]][a-zA-Z]:表示任意大小写字母

      [[:space:]]表示任意空格

      [^] :表示匹配制定范围外的任意单个字符

 2、次数匹配:在期望匹配字符的后面提供一个控制符,用来表达匹配其前面字符指定的次数。

*    :表示任意长度,0次、1次、或多次

?   :匹配其前面的字符可以1次或0次,也就是说前面字符可有可无

+   :1次或多次,表示左侧字符至少出现一次

{n}   :n次表示其左侧字符精确出现n

{m,n}  :至少m次,至多n

{0,n}   :至多n

{m,0}   :至多m

 3、位置锚定

                ^  :用来锚定行首

                $  :用来锚定行尾

 4、单词锚定:有非特殊字符组成的连续字符串

               \<\b  :锚定词首

               \>\b  :锚定词尾

               \<PATTERN\>   :匹配PATTERN能匹配到的整个单词

 5、分组:在分组中的模式在某次具体的匹配过程中所匹配的字符,可以被grep记忆,保存于内置的变量中,这些变量是(\1\2…..\9)因此还可以被用来引用,其中(\1)用来引用自左而右由第一个左括号以及与之对应的右括号中模式所匹配到的内容,其中(\2)用来引用自左而右由第二个左括号以及与之对应的右括号中模式所匹配到的内容;

 

fgrep表示匹配的模版都被看做是字符串,因此元字符都作为普通字符来处理,使用方法类似,因此不做详细描述。

 

 正则表达式现在广泛应用于Unix系统、Linux系统以及PHPC#Java等开发环境中,灵活的运用正则表达式可以极大的简化日常工作,就好比每一个成为武林高手所必备的基本功,每一招每一式都需要勤加练习,这样才能做到运用自如。

原创文章,作者:zhang,如若转载,请注明出处:http://www.178linux.com/8930

(0)
zhangzhang
上一篇 2015-10-27
下一篇 2015-10-27

相关推荐

  • echo命令的简单用法和实例

        在CentOS 6.8版本下,通过实例的形式,展现选项和参数的灵活运用,可以简明的了解echo的用法。 一、语法:echo [SHORT-OPTION]… [STRING]… ;echo [选项]…[参数]       作用:将需要的内容输出到终端或者其他文件。 二、实例和选项参数的用法: (1)文本…

    Linux干货 2017-03-27
  • TCP网络关闭的状态变换时序图

    TCP共有11个网路状态,其中涉及到关闭的状态有5个。 在我们编写网络相关程序的时候,这5个状态经常出现。因为这5个状态相互关联,相互纠缠,而且状态变化触发都是由应用触发,但是又涉及操作系统和网络,所以正确的理解TCP 在关闭时网络状态变化情况,为我们诊断网络中各种问题,快速定位故障有着非常重要的作用和意义。 下是是根据W.Richard Stevens的《…

    Linux干货 2015-04-03
  • 网络组Network Team

    网络组Network Team 网络组team:是将多个网卡聚合在一起,从而实现容错和提高吞吐量 1 创建网络组接口 nmcli connection add type team con-name TEAMname ifname INTname [config JSON] TEAMname 指定连接名,INname指定接口名, JSON指定runner方式,…

    Linux干货 2017-05-07
  • iptables

      iptables(1) Firewall:隔离工具;Packets Filter Firewall;工作于主机或网络的边缘,对经由的报文根据预先定义的规则(匹配条件) 进行检测,对于能够被规则匹配到的报文实行某预定义的处理机制的一套组件;     硬件防火墙:在硬件级别实现部分功能的防…

    Linux干货 2016-11-01
  • 安装命令及源码安装

    rpm命令  –q:查询 -qa:查询系统内所有已安装的包 -qf:查询文件来自于那个安装包 -ql:安装包内的文件 -qp:与其他命令配合可以查询未安装包的信息,但要跟完整的安装包名 -qi:查看报的详细信息 -qc:查询程序的配置文件 -qd:查询程序的文档 -qR:查询安装包依赖的程序 –scripts:查看安装包内的脚本 -q …

    Linux干货 2016-08-26
  • DevOpsDays大会,818坐标上海,我们来啦!!!

    DevOpsDays 818, 坐标上海, DevOpsDays上海大会, 我们来啦!!! 我们来啦!!! 我们来啦!!! 重要的事情说三遍。 标签: 运维  移动开发  IT技术  DevOps  2008年的敏捷会议上,Andrew Clay Shafer 和 Patrick Debois 讨论了关于“敏…

    Linux干货 2017-08-10

评论列表(2条)

  • stanley
    stanley 2015-10-27 23:15

    内容很丰富,格式上有些乱失去了层次主次,不容易吸引用户

  • Wlibang
    Wlibang 2015-12-06 09:22

    [[:lower:]]或[a-z]:表示a-z范围内任意单个字母 前者精确匹配小写字母,后者不区分大小写