正则表达式的概念和用法

概念

正则表达式是对字符串操作的一种逻辑表达方式,很多情况下我们需要在茫众多的文件中找到我们需要的文件时,就需要用到正则表达式了

正则表达式就如同一个过滤器,能够筛选出希望得到的字符串。它可以检索、替换符合我们自己规定格式的所有文本。

  • 正则表达式分两类

    • 基本正则表达式
    • 扩展正则表达式

正则表达式的用法和选项

在Linux中,正则表达式通常会配合文本过滤工具grep使用。

  • grep的功能强大,且简单粗暴。

正则表达式的概念和用法 

正则表达式的概念和用法

以/etc目录为例

我们用grep来筛选一下其中含有”li”的文件

 

正则表达式的概念和用法

这是利用grep在/etc中对字母”li”进行筛选

如果我们只想要以”li”为首字母的文件要怎么做呢?
这就需要用到正则表达式了

正则表达式的概念和用法

可以看到依靠正则表达式能很轻松的达到我们想要的结果。

正则表达式还有更多更强大的功能,让我们来了解一下吧。

  • 正则表达式
    正则表达式的元字符分类:匹配字符、匹配字数、位置锚定、分组

    • 字符匹配:

      匹配任意单个字符
      []              匹配指定范围内的任意单个字符
      [^]             匹配指定范围外的任意单个字符
      [[:alnum:]]     字母和数字
      [[:alpha:]]     代表任何英文大小写字符,亦即 A-Z, a-z
      [[:lower:]]     小写字母 
      [[:upper:]]     大写字母
      [[:blank:]]     空白字符(空格和制表符) 
      [[:digit:]]     十进制数字
      [[:xdigit:]]    十六进制数字
      [[:graph:]]     可打印的非空白字符
      [[:print:]]     可打印字符
      [[:punct:]]     标点符号
    • 正则表达式的概念和用法

      正则表达式的概念和用法

     

    • 匹配字数(””为转译符,防止系统将某些字符当命令处理)

      \*      匹配前面的字符任意次,包括0次
      
      \+      匹配前面的字符1次以上,不包括0次
      
      *?      匹配前面任意次,但尽可能少重复
      
      .*      任意长度的任意字符
      
      \?      匹配其前面的字符0或1次
      
      \+      匹配其前面的字符至少1次
      
      \{n\}   匹配前面的字符n次
      
      \{m,n\} 匹配前面的字符至少m次,至多n次
      
      \{,n\}  匹配前面的字符至多n次
      
      \{n,\}  匹配前面的字符至少n次
    • 正则表达式的概念和用法

      正则表达式的概念和用法

    • 位置锚定 :

      ^   行首锚定,用于模式的最左侧
      
      $   行尾锚定,用于模式的最右侧
      
      \< 或 \b     词首锚定,用于单词模式的左侧
      
      \> 或 \b     词尾锚定;用于单词模式的右侧
      
      \<PATTERN\> 匹配整个单词
    • 分组

      分组 : \(\) 将一个或多个字符捆绑在一起,当作一个整体进行处理,如 : \(root\)+

      后向引用 : 引用前面的分组括号中的模式所匹配字符,而非模式本身

      或者 : \|

    • 正则表达式的概念和用法

  • 扩展正则表达式
    扩展正则表达式是正则表达式的优化版,元字符的表达更简洁,更方便。
    在grep中需要加选项 “-e” 来启用扩展正则表达式或egrep(=grep -e)

    • 在字符匹配中的双中括号在扩展正则表达式中可以简写为一个

      [ : alnum : ]   字母和数字
      [ : alpha : ]   代表任何英文大小写字符,亦即 A-Z, a-z
      [ : lower : ]   小写字母 
      [ : upper : ]   大写字母
      [ : blank : ]   空白字符(空格和制表符) 
      [ : digit : ]   十进制数字
      [ : xdigit : ]  十六进制数字
      [ : graph : ]   可打印的非空白字符
      [ : print : ]   可打印字符
      [ : punct : ]   标点符号
    • 大部分转译符(\)可以省略

      *: 匹配前面字符任意次
      
      ? : 0或1次
      
      +: 1次或多次
      
      {m} : 匹配m次
      
      {m,n} : 至少m,至多n次
      
      a|b : a或b
      
      C|cat : C或cat
      
      (C|c)at : Cat或cat

总结

正则表达式的功能很强大且很好用,理解上也可能对于字符表达的含义会有些混乱需要多用多记才能熟练掌握。

原创文章,作者:kstg5663294,如若转载,请注明出处:http://www.178linux.com/77818

(0)
kstg5663294kstg5663294
上一篇 2017-06-10
下一篇 2017-06-11

相关推荐

  • N25-第一周博客作业

    1、描述计算机的组成及其功能:    没有听马哥视频之前,计算机的组成理解为主机+显示器;    听完视频之后,对计算机的组成分为硬件系统和软件系统。    硬件系统主要有:运算器、控制器、存储器、输入设备和输出设备;    软件系统主要有…

    Linux干货 2016-12-04
  • N25第四周 chmod chown以及 grep命令的常用示例

    1、复制/etc/skel目录为/home/tuser1,要求/home/tuser1及其内部文件的属组和其它用户均没有任何访问权限。     [root@localhost ~]# cp -r /etc/skel /home/tuser1   &n…

    Linux干货 2016-12-22
  • 在马哥学习linux第一天的感受

         来马哥教育好几天了,昨天算是正式开始,在昨天早上,举行了开班典礼,各位老师助教为我们介绍了在马哥教育进行培训的相关注意事项,下午进行了两场测试,首先有一个摸底测试,不得不说我真的是太菜了,除了一些比较简单的题目我还有些把握,相当一部分我都是似曾相识,但是也不是很确定,还有很大一部分我根本听都没听说过,看到别人都写的满满…

    Linux干货 2017-07-11
  • Linux入门详解(第一周)

    Linux入门 1. 描述计算机的组成及其功能 计算机硬件的五大组成部分为:运算器、控制器、存储器、输入设备和输出设备; CPU:CPU是执行存储在主存中指令的引擎;内部又分为算数逻辑单元和控制单元,其中算数逻辑单元主要负责程序的运算与逻辑判断,控制单元则主要是协调各周边组件与各单元间的工作;此外CPU内还包含寄存器(如PC)和高速缓存等; 存储器:这里指主…

    Linux干货 2016-08-29
  • shell脚本一键分区

    #!/bin/bash #实现硬盘自动分区助手 echo "当前所有分区:" echo `fdisk -l|grep "Disk /dev/[sh]d"|cut -d: -f1|awk '{print $2 &q…

    Linux干货 2016-07-26
  • 位置变量&特殊变量总结

    位置变量 常用的位置变量有 $1, $2, $3 ……,表示命令行传给脚本的第一个参数,第二个参数,第三个参数。。。 $0 表示脚本的文件名,比如a.sh 位置变量在脚本中的主要作用,是让脚本通过他们来获取命令行传递给脚本的参数。 变量位置调整 shift [n] 用于调整变量位置 第n+1个位置变量会被重新命名为$1…

    Linux干货 2016-08-15