grep的使用,正则表达式

文本处理grep
    grep :根据模式去搜索文本,并将匹配到的文本显示出来
pattern(模式):文本字符和正则表达式的元字符组合而成的匹配条件
正则表达式:(REGular EXPression)正则表达式就是处理字符串的方法,通过一些特殊字符的辅助,让用户轻松方便的达到查找、删除、修改特定字符串的处理程序
grep 的用法
    name: grep, egrep, fgrep – print lines matching a pattern
  grep [OPTIONS] PATTERN [FILE…]
       grep [OPTIONS] [-e PATTERN | -f FILE] [FILE…]
option:
  –color=auto    匹配到的字符串带颜色显示出来(auto的自动附加颜色)
  -i :匹配字符的时候忽略大小写
        example: grep -i  “uuid”  /etc/passwd
  -v : 取反,显示没有被匹配到的行
      example: grep -v  “uuid”  /etc/passwd
  -n:显示匹配的行号
       -c: 统计匹配的行数
       -o: 仅显示匹配到的字符串,其他不显示
       -q: 静默模式,不输出任何信息(相当于重定向到&>/dev/null)
       -A #: after, 后#行
       -B #: before, 前#行
       -C #:context, 前后各#行 显示匹配到字符串的前后各#行
       -e:实现多个选项间的逻辑or关系
           grep –e ‘cat ’ -e ‘dog’ file
       -w:匹配整个单词
            example: grep -w bash filename   (bash 可以匹配   basher 匹配不到)
               数字,字母,下划线不可以作为单词的分隔符(界线)
       -E:使用ERE(grep -E 相当于 egrep)
       -F:相当于fgrep,不支持正则表达式
字符匹配:
       . 匹配任意单个字符
       example: r..t    root,rabt,r12t(字母,数字,符号,相同不相同,只要是两个) 都可以匹配。
       [] 匹配指定范围内的任意单个字符
       example: [abcd] 匹配到a或者b或者c或者d
       [^] 匹配指定范围外的任意单个字符
       example: [^wang]匹配wang之外的字符
       [:alnum:] 字母和数字
       [:alpha:] 代表任何英文大小写字符,亦即A-Z, a-z
       [:lower:] 小写字母[:upper:] 大写字母
       [:blank:] 空白字符(空格和制表符)
       [:space:] 水平和垂直的空白字符(比[:blank:]包含的范围广)
       [:cntrl:] 不可打印的控制字符(退格、删除、警铃…)
       [:digit:] 十进制数字[:xdigit:]十六进制数字
       [:graph:] 可打印的非空白字符
       [:print:] 可打印字符
       [:punct:] 标点符号
匹配次数:用在要指定次数的字符后面,用于指定前面的字符要出现的次数
       * 匹配前面的字符任意次,包括0次(工作在贪婪模式)
            贪婪模式:尽可能长的匹配
       .*任意长度的任意字符
       \?匹配其前面的字符0或1次
       example :  root\?  表示匹配其前面的字符也就是t一次或者0次 比如:root  roo
       \+匹配其前面的字符至少1次
       example : root\+  表示匹配t字符至少一次以上,比如:root  roottt rootttttt
       \{n\}匹配前面的字符n次
       \{m,n\}匹配前面的字符至少m次,至多n次
       \{,n\}匹配前面的字符至多n次
       \{n,\}匹配前面的字符至少n次
    位置锚定:定位出现的位置
       ^ 行首锚定,用于模式的最左侧
       $ 行尾锚定,用于模式的最右侧
       ^PATTERN$ 用于模式匹配整行
           ^$ 空行
           ^[[:space:]]*$ 空白行
       \< 或\b词首锚定,用于单词模式的左侧
       \> 或\b词尾锚定;用于单词模式的右侧
       \<PATTERN\>匹配整个单词
分组:\(\) 将一个或多个字符捆绑在一起,当作一个整体进行处理,
            如:\(root\)\+,将root作为一个整体使用,root\+ 只是匹配t字符
         分组括号中的模式匹配到的内容会被正则表达式引擎记录于内部的变量中,这些变量的命名方式为: \1, \2, \3, …
         \1表示从左侧起第一个左括号以及与之匹配右括号之间的模式所匹配到的字符
             示例:\(string1\+\(string2\)*\)
                   \1 :string1\+\(string2\)*
                   \2 :string2
        后向引用:引用前面的分组括号中的模式所匹配字符,而非模式本身
练习
   1、显示/proc/meminfo文件中以大小s开头的行(要求:使用两种方法)
        grep -i “^s” /proc/meminfo
grep -e ^s -e ^S /proc/meminfo
  2、显示/etc/passwd文件中不以/bin/bash结尾的行
        grep -v “/bin/bash$” /etc/passwd
  3、显示用户rpc默认的shell程序
        grep -w “^rpc” /etc/passwd |cut -d: -f7
  4、找出/etc/passwd中的两位或三位数
        grep -o “\b[0-9]\{2,3\}\b” /etc/passwd
  5、显示CentOS7的/etc/grub2.cfg文件中,至少以一个空白字符开头的且后面存非空白字符的行
        grep “^[[:space:]]\+[^[:space:]]” /etc/grub2.cfg
  6、找出“netstat -tan”命令的结果中以‘LISTEN’后跟任意多个空白字符结尾的行
        netstat -tan |grep “LISTEN[[:space:]]*$”
  7、显示CentOS7上所有系统用户的用户名和UID
        cut -d: -f1,3 /etc/passwd |grep “\b[0-9]\{1,3\}$”
  8、添加用户bash、testbash、basher、sh、nologin(其shell为/sbin/nologin),找出/etc/passwd用户名同shell名的行
        grep “^\(.*\)\>.*\b\1$” /etc/passwd
   9、利用df和grep,取出磁盘各分区利用率,并从大到小排序
        df |grep “/dev/sd” |grep -o “[0-9]\{1,3\}%” |grep -o “[0-9]\{1,3\}” |sort
扩展正则表达式 ,egrep
      egrep = grep -E
 egrep[OPTIONS] PATTERN [FILE…]
  字符匹配:(用法和grep用法一致)
       . 任意单个字符
       [] 指定范围的字符
       [^] 不在指定范围的字符
   次数匹配:
       *:匹配前面字符任意次
       ?: 0或1次
       +:1次或多次
      {m}:匹配m次
      {m,n}:至少m,至多n次
  位置锚定:
       ^ :行首
       $ :行尾
       \<, \b :语首
       \>, \b :语尾
   分组:
       ()
       后向引用:\1, \2, …
   或者:(|表示或者,|前后分别是两个字符,)
        a|b: a或b
        C|cat: C或cat
        (C|c)at:Cat或cat  (括号表示展开)

本文来自投稿,不代表Linux运维部落立场,如若转载,请注明出处:http://www.178linux.com/88866

(0)
燕李鹏燕李鹏
上一篇 2017-11-25 11:40
下一篇 2017-11-25 23:10

相关推荐

  • 进程和计划任务

    1、进程概念 内核的功用:进程管理、文件系统、网络功能、内存管理、驱动程序、安全功能等; 进程是运行中的程序的一个副本,是被载入内存的一个指令集合; 进程ID(PID )号码被用来标记各个进程; UID、GID 和SELinux 语境决定对文件系统的存取和访问权限,这些权限通常从执行进程的用户来继承并且存在生命周期; task struct:Linux内核存…

    Linux干货 2016-09-13
  • 网络班第27期第二周作业

    1、 Linux上的文件管理类命令都有哪些,其常用的使用方法及其相关的实例演示。 cp命令:copy 文件à>目录 文件à>文件 目录->文件(报错)           目录->目录 常用选项:     &nbsp…

    2017-07-31
  • 马哥教育网络班22期+第三周课程练习

    1、列出当前系统上所有已经登录的用户的用户名,注意:同一个用户登录多次,则只显示一次即可。  who | tr -s [[:space:]] | cut -d" " -f1 | sort -u [root@localhost cdrom]# who root     pts/1     &…

    Linux干货 2016-09-07
  • 高级文件系统的管理

    接上一篇文章http://www.178linux.com/40874 移动介质     挂载意味着 使外来的文件系统看起来如同是主目录树 的 一部分     访问前、介质必须被挂载     摘除时,介质必须被卸载   …

    Linux干货 2016-09-08
  • 马哥Linux学习之Linux背景和主要发行版篇

        Linux是一种 类Unix计算机操作系统的统称,简单的说来就是Linux内核+GNU工程的各种工具和数据库。Linux包括各种Linux的发行版,其实也就是为达到不同的目的而制作(目的包括对不同计算机结构的支持,对一个具体区域或语言的本地化,实时应用或嵌入式)的不同版本。     Linux的由来.…

    2015-03-19
  • 第三周 磁盘文件系统进阶

    文件系统的使用:     首先要“挂载”:mount 命令和umount命令     根文件系统这完的其他文件系统要想能够访问, 都必须通过“关联”至根文件上的某个目录来实现,次关联操作即为“挂载”;此目录几位“挂载点”;     挂载点:mount-point,用于做为另一个文件系统的访问入口; …

    Linux干货 2016-11-22