深入了解正则表达式与grep应用

刚开始学习正则表达式时候,感觉和看无字天书没什么分别,迷茫了一段时间后,仔细去理解,慢慢你会发现也没什么的。认真去钻研了,多练习,是可以理解他们的含义的。也许正如老师所言,学习linux ,入门的确很陡峭,对于我这个基础薄弱,智商低于80的人来说的确很吃力。
关于正则概念的就不去描述了,说起来真的不好表达,下面通过一些实例来进行深入理解吧。

  • 1.显示当前系统上面的root,fedora,或usr1的默认shell
    [root@dxlcentOS ~]# egrep “^(root|fedora|user1)” /etc/passwd | cut -d: -f7
    /bin/bash
    /bin/tcsh
    /bin/bash
    这实例用到了正则的或”|”,^(root|fedora|user1)表示这三个其中一个出现行首的对进行匹配,后面的cut就不用说了,匹配后进行切割出来。
  • 2.找出/etc/rc.d/init.d/functions文件中的某单词后面跟一组小括号的行,如hello()
    [root@dxlcentOS ~]# egrep “<[[:alnum:]]+>()” /etc/rc.d/init.d/functions
    checkpid() {
    daemon() {
    killproc() {
    [root@dxlcentOS ~]# egrep -o “[[:alnum:]]+()” /etc/rc.d/init.d/functions 不要锚定词首和词尾也行
    checkpid()
    checkpids()
    kill()
    ……..
  • 3.使用一个echo命令输出一个绝对路径名,使用grep取出其基名。再尝试取路径名
    [root@dxlcentOS ~]# echo “/etc/rc.d/init.d/functions” | cut -d/ -f5
    functions
    [root@dxlcentOS ~]# echo “/etc/rc.d/init.d/functions” | cut -d/ -f1-4 取路径名
    /etc/rc.d/init.d
    [root@dxlcentOS ~]# echo “/etc/rc.d/init.d/functions” | egrep -o “[/].*/”
    /etc/rc.d/init.d/ 取路径名,以“/”开始中间跟任意字符,以“/”结束
    [root@dxlcentOS ~]# echo “/etc/rc.d/init.d/functions” | egrep -o “[^/]+$”
    functions 取基名:以非“/”开始,“$”锚定行尾,匹配行尾出现1次以上的字符
  • 4.找出ifconfig命令结果中的0-255之间的数字
    [root@dxlcentOS ~]# ifconfig | egrep -o “<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-5][0-5])>”
    192
    168
    0
    196
    255
    ………….
    [0-9] 匹配一位数。 [1-9][0-9] 匹配两位数。1[0-9][0-9] 匹配100-199之间的数。2[0-5][0-5] 匹配200-255之间的数值。“|”表示或。([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-5][0-5])表示分组。<…>表示锚定词首和词尾。总体的理解是首先进行0-255的数值定好,锚定他们一位数,两位数,三位数分别作为一个整体然后进行匹配。有了这个基础匹配下面的ip地址就容易理解了。
  • 5.用grep匹配出ifconfig命令结果的合理的IP地址
    [root@dxlcentOS ~]# ifconfig | egrep “<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-5][0-5])>.(<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-5][0-5])>.){2}<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-5][0-5])>”
    inet 192.168.0.196 netmask 255.255.255.0 broadcast 192.168.0.255
    inet 192.168.0.113 netmask 255.255.255.0 broadcast 192.168.0.255
    inet 127.0.0.1 netmask 255.0.0.0
    第一步:先把0-255的数值匹配出来。第二步:再把IP地址之间的“.”匹配出来,(<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-5][0-5])>.){2} 中间匹配两次。第三步匹配最后一个IP地址数值。
    用grep过滤IP地址的确是比较麻烦。为了理解正则很有帮助。用awk sed,cut等工具很快可以取IP地址。
  • 6.写一个模式,能匹配出所有电子邮件地址
    首先了解下邮箱的格式:
    1)邮箱里面必须包含@符。
    2)用户名,@前面的字符,可以自己选择。由字母a-z(不区分大小写)、数字0-9;只能以数字或字母开头和结尾,例如:tom_cat;用户名长度为4~18个字符 。
    3)邮箱必须以顶级域名 .com ,.cn , .edu .org .net 等结尾。
    4) 字符”@”和 “. “之间只能是小写字母和数字组成,不能有特殊字符,长度2-12个。
    [root@dxlcentOS ~]# grep -E “[[:alnum:]]{4,18}@[[:alnum:]]{2,14}.(com|cn|net|org)” /tmp/email

本文来自投稿,不代表Linux运维部落立场,如若转载,请注明出处:http://www.178linux.com/88181

(0)
N27_dxldengN27_dxldeng
上一篇 2017-11-01
下一篇 2017-11-02

相关推荐

  • liunx初探

    计算机的五大单元: 输出单元、输入单元、cpu内部控制单元、算术逻辑单元和内存。 计算机三大组成部分: 输入单元:键盘、鼠标等等 输出单元:屏幕、打印机等 中央处理器(CPU):含有算术逻辑、控制、记忆等 CPU种类有两种分别是:   精简指令集(RISC):这种cpu微指令比较精简,每个指令的执行时间都很短,完成的操作也很简单。常见的简单指令集C…

    Linux干货 2016-09-14
  • 管道:管道符;cat和more命令 重定向:文件标识符:I/O重定向符号及其用法;exec命令;代码块重定向 命令行处理:命令行处理流程;eval命令 管道: 管道是Linux编程中最常用的技术之一,Shell编程中竖杠符号:“|” command1 | command2 | command3 | … |commandn command1到commandn表…

    Linux干货 2016-08-05
  • CentOS程序安装的3种方式{ 源码包安装 | rpm包安装 | yum安装;}

    CentOS程序安装的3种方式{ 源码包安装 | rpm包安装 | yum安装;} CentOS软件安装主要由3种方式,第一种是源码包安装,需要从网站下载并解压之后通过手动编译的方式安装,过程相对比较复杂;第二种是rpm包安装,通过rmp这个包管理器实现程序的安装、升级、卸载等操作,rpm包管理器是RPM Package Manager的简称,功能非常强大,…

    Linux干货 2016-08-24
  • 如何使用正则表达式

    正则表达式(Regular Expression)就是使用简单的字符按照预先设定的规则来完成复杂的功能,说白了,正则表达式是一种字符串的匹配方式,就是用预先设定好的规则来描述我们想要表达的内容,它是由普通字符以及元字符组成的字符串,其中元字符不表示本身的意义,而是用于表达控制或通配等功能。 为什么要用这个东西那,我想,每一个学习计算机的人都应该明白,计算机就…

    Linux干货 2015-10-27
  • 文件权限

    小技巧 除root用户外其他用户将不能登录 touch /etc/nologin 或touch /run/nologin echo “system is maintaining”>> /etc/nologin 文件属性 文件的权限主要针对三类对象进行定义: owner: 属主, u 修改文件的属主: chown [OPTION]… […

    Linux干货 2016-08-08
  • 用户及权限管理

     今天是学习马哥教育第四天,也是第一个博客作业,写一篇关于用户及权限管理的简介型的博客文章,作文水品有限,所以写出来有可能有病句或者意境有问题,请大家多多包涵。  首先,用户及权限管理,需要从2方面入手来说,首先来说用户管理。  何谓用户,这是马哥一上来就提到的问题,我简单的理解,用户其实就是一个人机交互的接口,人机交互的接口是…

    Linux干货 2016-09-15