GREP正则表达式:
复习:
glob文件通配符: *:任意长度字符: ?:任意单个字符: []:括号内的任意单个字符: [^]:括号内字符除外: [:digit:]:任意数字-->[0-9]: [:space:]:空白字符: [:lower:]:任意小写字母: [:upper:]:任意大写字母: [:alpha:]:任意字母不区分大小写: [:alnum:]:任意字母或数字: [:punct:]:标点符号:
练习:
显示/var目录下所有以l开头,以一个小写字母结尾,且中间出现至少一位数字的文件或目录; [user1@localhost ~]$ ls /var/l[[:digit:]]*[[:lower:]] 显示/etc目录下,以任意一位数字开头,且以非数字结尾的文件或目录; [root@localhost ~]# ls /etc/[[:digit:]]*[^[:digit:]] 显示/etc/目录下,以非字母开头,后面跟了一个字母及其它任意长度任意字符的文件或目录; [root@localhost ~]# ls /etc/[^[:alpha:]][[:alpha:]]* 复制/etc目录下,所有以m开头,以非数字结尾的文件或目录至/tmp/mageedu目录中; [root@localhost ~]# cp -a /etc/m*[^[:digit:]] /tmp/mageedu 复制/etc目录下,所有以.d结尾的文件或目录至/tmp/magedu.com目录中; [root@localhost ~]# cp -a /etc/*.d /tmp/magedu.com 复制/etc目录下,所以有.conf结尾,且以m,n,r,p开头的文件或目录至/tmp/mageedu.com目录中; [root@localhost ~]# cp /etc/[mnrp]*.conf /tmp/mageedu.com
重定向
>:覆盖重定向,目标文件的原有内容被清除: [root@localhost ~]# cat /etc/fstab > /tmp/wanghongkai [root@localhost ~]# [root@localhost ~]# cat /tmp/wanghongkai # # /etc/fstab # Created by anaconda on Sun Jul 10 08:30:21 2016 # # Accessible filesystems, by reference, are maintained under '/dev/disk' # See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info # UUID=36e12a53-107b-4f2c-93d2-1a4836d67bab / ext4 defaults 1 1 UUID=b66484d9-582d-4371-b4d0-e4ced790c209 /boot ext4 defaults 1 2 UUID=001595df-98dd-441b-bb32-267407ff2e30 /home ext4 defaults 1 2 UUID=6578a451-4708-43da-b64c-376745edcefe swap swap defaults 0 0 tmpfs /dev/shm tmpfs defaults 0 0 devpts /dev/pts devpts gid=5,mode=620 0 0 sysfs /sys sysfs defaults 0 0 proc /proc proc defaults 0 0 [root@localhost ~]# cat /etc/issue > /tmp/wanghongkai [root@localhost ~]# cat /tmp/wanghongkai CentOS release 6.4 (Final) Kernel \r on an \m >>:追加重定向,新内容会追加至目标文件尾部: [root@localhost ~]# cat /etc/fstab >> /tmp/wanghongkai [root@localhost ~]# cat /tmp/wanghongkai CentOS release 6.4 (Final) Kernel \r on an \m # # /etc/fstab # Created by anaconda on Sun Jul 10 08:30:21 2016 # # Accessible filesystems, by reference, are maintained under '/dev/disk' # See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info # UUID=36e12a53-107b-4f2c-93d2-1a4836d67bab / ext4 defaults 1 1 UUID=b66484d9-582d-4371-b4d0-e4ced790c209 /boot ext4 defaults 1 2 UUID=001595df-98dd-441b-bb32-267407ff2e30 /home ext4 defaults 1 2 UUID=6578a451-4708-43da-b64c-376745edcefe swap swap defaults 0 0 tmpfs /dev/shm tmpfs defaults 0 0 devpts /dev/pts devpts gid=5,mode=620 0 0 sysfs /sys sysfs defaults 0 0 proc /proc proc defaults 0 0 2>:覆盖重定向错误输出数据流: [root@localhost ~]# car /etc/passwd 2> /tmp/wanghongkai [root@localhost ~]# cat /tmp/wanghongkai -bash: car: command not found 2>>:追加重定向错误输出数据流: [root@localhost ~]# cat /tmp/wanghongkai cat: /etc/rpm: Is a directory [root@localhost ~]# car /etc/ 2>> /tmp/wanghongkai [root@localhost ~]# cat /tmp/wanghongkai cat: /etc/rpm: Is a directory -bash: car: command not found 合并标准输出和错误输出为用一个数据流进行重定向; &>:覆盖重定向 [root@localhost ~]# cat /etc/issue /etc/sddd &> /tmp/wanghongkai [root@localhost ~]# cat /tmp/wanghongkai CentOS release 6.4 (Final) Kernel \r on an \m cat: /etc/sddd: No such file or directory &>>:追加重定向
练习
将etc/passwd文件中的前5行内容转换为大写后保存至/tmp/passwd.out文件中: [root@localhost ~]# head -n5 /etc/passwd | tr 'a-z' 'A-Z' > /tmp/passwd.out [root@localhost ~]# cat /tmp/passwd.out ROOT:X:0:0:ROOT:/ROOT:/BIN/BASH BIN:X:1:1:BIN:/BIN:/SBIN/NOLOGIN DAEMON:X:2:2:DAEMON:/SBIN:/SBIN/NOLOGIN ADM:X:3:4:ADM:/VAR/ADM:/SBIN/NOLOGIN LP:X:4:7:LP:/VAR/SPOOL/LPD:/SBIN/NOLOGIN 将登陆至前系统上的用户信息中的后3为的信息转换为大写后保存至/tmp/who.out [root@localhost ~]# w | tail -n3 | tr 'a-z' 'A-Z' > /tmp/who.out [root@localhost ~]# cat /tmp/who.out MAGEIA PTS/4 192.168.1.3 19:36 2:16M 0.02S 0.02S -BASH ROOT PTS/5 192.168.1.3 20:09 0.00S 0.13S 0.00S W USER1 PTS/6 192.168.1.3 20:10 26:13 0.02S 0.02S -BASH
文本处理工具:wc,cut,sort,uniq
这里就不一一介绍了下面用实验来表达上述文本处理工具:
练习:
以冒号分隔,取出/etc/passwd文件的第6至第10行,并将这些信息按第3个字段的数值大小进行排序;最后仅显示的各自的第1个字段; [root@localhost ~]# head -n10 /etc/passwd | tail -n5 | sort -t':' -k3 -n | cut -d':' -f1 sync shutdown halt mail uucp
grep:正则表达–>Linux上的文本处理三剑客
grep:文本过滤(模式:pattern)工具 grep,egrep,fgrep sed:stream editor:文本编辑工具; awk:Liunx上实现gwak 文本报告生成器: 模式:由正则表达式字符及文本字符所编写的过滤条件; REGEXP:由一类特殊字符及文本字符所编写的模式,其中有些字符不表示字符字面意义 而表示控制或同配的功能 使用nano 或vi编辑器:~/.bashrc中加入alias 定义的别名!!!!!!!!!! 正则表达式: 基本正则表达式:BRE 扩展正则表达式:ERE grep -E=egrep
基本正则表达式元字符:
字符匹配: :匹配任意单个字符: []:指定范围内的单个字符: [^]:匹配范围之外的任意单个字符: 匹配次数:用在要指定次数的字符后面,用于指定前面的字符要出现的次数; *:匹配前面的字符任意次:不表示多余的意义 例如:grep ”x*y“ abxy xay xxxxy .*:任意长度的任意字符: \?:匹配其前面的字符0或1次:即前面的字符可有可无 \+:匹配其前面的字符至少1次; \{m\}:匹配前面的字符m次: \{m.n\}:匹配前面的字符至少m次,至多n次; \{0,n\}:匹配前面的字符至多n次: \{m,\}:匹配前面的字符至少m次: 位置锚定: ^:行首锚定 例如:^root 已root开头:用于模式的最左侧: $:行尾锚定 ^PATTERN$:用于模式匹配正行: ^$:空行: ^[[:space:]]*$:空格字符 \<或\b:词首锚定:用于单词模式的左侧:例如:\<root \<或\b:词尾锚定:用于单词模式的右侧: \<PATTERN\>:匹配整个单词: [root@localhost etc]# grep "\<root\>" /etc/passwd root:x:0:0:root:/root:/bin/bash operator:x:11:0:operator:/root:/sbin/nologin 分组: \(\):将一个或多个字符捆绑在一起,当作一个整体进行处理: 例如:\(xy\)*ab:xy出现多次 Note:分组括号中的模式匹配到的内容会被正则表达式引擎记录于内部的变量中,这些变量的命名方式为: \1, \2, \3, ... \1: 从左侧起,第一个左括号以及与之匹配右括号之间的模式所匹配到的字符; \(ab\+\(xy\)*\): \1: ab\+\(xy\)* \2: xy
练习:
显示/proc/meminfo文件中以大小s开头的行;(要求:使用两种方式) [root@localhost ~]# grep '^[Ss]' /proc/meminfo [root@localhost ~]# grep -i "^s" /proc/meminfo 显示/etc/passwd文件中不以/bin/bash结尾的行; grep -v '/bin/bash$' /etc/passwd egrep -v "(/bin/bash)$" /etc/passwd 显示/etc/passwd文件中ID号最大的用户的用户名; [root@localhost ~]# sort -t':' -k3 -n /etc/passwd | tail -n1 | cut -d':' -f1 nfsnobody 如果用户root存在,显示其默认的shell程序; [root@localhost ~]# id root >& /dev/null && grep "^root" /etc/passwd | cut -d ':' -f7 /bin/bash 找出/etc/passwd中的两位或三位数; grep "\<[[:digit:]]\{2,3\}\>" /etc/passwd | wc -l 显示/etc/rc.d/rc.sysinit文件中,至少以一个空白字符开头的且后面存非空白字符的行; grep "^[[:space:]]\+[^[:space:]]" /etc/rc.d/rc.sysinit | wc -l 找出"netstat -tan"命令的结果中以'LISTEN'后跟0、1或多个空白字符结尾的行; netstat -tan | grep "LISTEN\>[[:space:]]\{0\}$" 添加用户bash、testbash、basher以及nologin(其shell为/sbin/nologin);而后找出/etc/passwd文件中用户名同shell名的行; [root@localhost ~]# grep "^\([[:alnum:]]\+\>\).*\1$" /etc/passwd sync:x:5:0:sync:/sbin:/bin/sync shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown halt:x:7:0:halt:/sbin:/sbin/halt nologin:x:3009:3009::/home/nologin:/sbin/nologin
EGREP 扩展的正则表达式
egrep [OPTIONS] PATTERN [FILE...] 字符匹配:.[] [^] 次数匹配: * ?: 0或1次; +:1次或多次; {m}:匹配m次; {m,n}:至少m,至多n次; 锚定: ^ $ \<, \b \>, \b 分组: () 后向引用:\1, \2, ...
练习:
显示当前系统root、centos或user1用户的默认shell和UID; [root@localhost ~]# egrep "^(root|centos|user1)" /etc/passwd | cut -d':' -f1,3,7 root:0:/bin/bash user1:501:/bin/bash centos:3010:/bin/bash 找出/etc/rc.d/init.d/functions文件(centos6)中某单词后面跟一个小括号的行; [root@localhost ~]# grep -E -o "^[_[:alpha:]]+\(\)" /etc/rc.d/init.d/functions 使用echo输出一绝对路径,使用egrep取出其基名; echo "/mnt/sdc" | grep -E -o "[^/]+/?$" | cut -d"/" -f1 找出ifconfig命令结果中1-255之间的数值; [root@localhost ~]# ifconfig | grep '[0-9]\{1,\}[/./][0-9]\{1,\}[/./][0-9]\{1,\}[/./][0-9]\{1,\}' inet addr:192.168.1.5 Bcast:192.168.1.255 Mask:255.255.255.0 inet addr:127.0.0.1 Mask:255.0.0.0 找出ifconfig命令结果中的IP地址; [root@localhost ~]# ifconfig | grep 'inet addr:[1-9]\{1,\}[/./][0-9]\{1,\}[/./][0-9]\{1,\}[/./][1-9]\{1,\}' inet addr:192.168.1.5 Bcast:192.168.1.255 Mask:255.255.255.0 inet addr:127.0.0.1 Mask:255.0.0.0 ifconfig | grep -o 'inet addr:[1-9]\{1,\}[/./][0-9]\{1,\}[/./][0-9]\{1,\}[/./][1-9]\{1,\}' **inet addr:192.168.1.5** **inet addr:127.0.0.1** ☆★☆★此处请老师帮忙看一下,我是否匹配对!!
原创文章,作者:wostop,如若转载,请注明出处:http://www.178linux.com/24143
评论列表(2条)
写的很好,排版也很漂亮,ip地址的匹配不是太对,在匹配一下试试,加油
@马哥教育:ifconfig | egrep -o “(\|\|\<2[0-5][0-4])[.](\|\|\<2[0-5][0-4])[.](\|\|\<2[0-5][0-4])[.](\|\|\<2[0-5][0-4])"
192.168.1.5
127.0.0.1