Day06笔记总结:grep与正则表达式

Title: grep与正则表达式
Date: 2018-04-08
Author: Alvin

一、描述

搜索符合条件的所有行,并将结果输出到STDOUT;
默认搜索匹配的PATTEN在行中的位置不确定。
二、常见用法
grep PATTEN FILE
//搜索匹配PATTEN字符串的所有行
//PATTEN:过滤条件,也叫搜索匹配条件
“root”        //字符串
“$USER”       //变量–>字符串
`whoami`      //命令–>执行结果–>字符串
grep -v PATTEN FILE
//搜索匹配不包含PATTEN符串的所有行
grep -n PATTEN FILE
//搜索结果加行号
//等价写法:cat -n FILE | grep PATTEN
grep -i PATTEN FILE
//PATTEN字符串忽略大小写
grep -o PATTEN FILE
//只搜索PATTEN字符串本身
grep -q PATTEN FILE
//静默执行,不显示结果
//等价写法:grep PATTEN FILE &> /dev/null
$?      0       //有包含PATTEN的行
$?      1       //无包含PATTEN的行
grep -A3 PATTEN FILE
//包含PATTEN字符串的后3行也做显示
grep -B3 PATTEN FILE
//包含PATTEN字符串的前3行也做显示
grep -C3 PATTEN FILE
//包含PATTEN字符串的前3行和后3行也做显示
grep PATTEN1 FILE | grep PATTEN2
//过滤同时包含PATTEN1和PATTEN2的所有行
grep -e PATTEN1 -e PATTEN2 FILE
//过滤包含PATTEN1或PATTEN2任意一个的所有行
grep -w WORDS FILE
//过滤包含WORDS单词的所有行
//在grep视角,
字母、数字、下划线:都属于单词的一部分
其他字符:视为单词的分隔符
grep -f PATTENLIST FILE
//先把PATTENLIST的内容识别成一个或多个PATTEN
PATTEN1 PATTEN2 […]
//然后过滤包含PATTEN1或PATTEN2或[…]任意一个的所有行
//等价写法:grep -e PATTEN1 -e PATTEN2 [-e […]] FILE
grep -E EXT_PATTEN FILE
//支持扩展的正则表达式
三、正则表达式(一):字符匹配
echo STRINGS | grep PATTEN
//用于字符匹配的特殊字符
.              //表示一个任意字符
\.             //转义字符,表示 . 本身
[.]            //中括号里面的 . 表示 . 本身,不需要转义
[xyz]          //取集合[x,y,z]中任意一个字符
[^xyz]         //取集合的补集中任意一个字符(不再包含x/y/z)
四、正则表达式(二):匹配次数
echo STRINGS | grep PATTEN
//用于匹配次数的特殊字符
c*             //表示字符c出现任意次数(零次/一次/多次)
.*             //表示任意一个字符出现任意次数(零次/一次/多次)
[a-z]*         //表示集合[a-z]闭区间中的任意一个字符出现任意次数(零次/一次/多次)
c\?            //表示字符c最多出现一次(零次/一次)
.\?            //表示任意一个字符最多出现一次(零次/一次)
[a-z]\?        //表示集合[a-z]闭区间中的任意一个字符最多出现一次(零次/一次)
c\+            //表示字符c至少出现一次(一次/多次)
.\+            //表示任意一个字符至少出现一次(一次/多次)
[a-z]\+        //表示集合[a-z]闭区间中的任意一个字符至少出现一次(一次/多次)
c\{16,\}       //表示字符c至少出现16次(16次/16+次)
c\{16,20\}    //表示字符c至少出现16次,但最多出现20次(16次/17次/18次/19次/20次)
c\{,20\}      //表示字符c最多出现20次(零次/一次/……/20次)
五、正则表达式(三):位置锚定
echo STRINGS | grep PATTEN
//用于位置锚定的特殊字符
^str          //表示以字符串str开头的行(行首)
str$          //表示以字符串str结尾的行(行尾)
^$            //表示完全的空行(无法过滤含有不可见字符的假空行)
^[:space:]*$  //表示包含空格键或Tab键的假空行和完全的空行(彻底过滤包含不可见字符的假空行)
\<word        //表示以字符串word为词首的单词(词首)
word\>        //表示以字符串word为词尾的单词(词尾)
\<word\>      //表示以字符串word为词首和词尾的单词(词首+词尾)
\bword\b      //界定符\b是单词的边界,表示把字符串word当做一个独立的单词(界定符)
//在grep视角,
字母、数字、下划线:都属于单词的一部分
其他字符:视为单词的分隔符
六、正则表达式(四):分组
echo STRINGS | grep PATTEN
//用于分组的特殊字符
\(str\)       //表示把字符串str整体当成一个分组
\(str\)\{3,\} //表示字符串分组str至少出现3次
\(str\).*\1   //等价写法: \(str\).*\(str\)
// \1 表示 \(str\) ,相当于字符串分组str
//表示把字符串分组str整体当作一个参考,在 .* 后必须出现一模一样的字符串分组str
//分组的匹配结果必须一样
\(str1\)\?.*\(str2\)\+\1.*\2
//等价写法: \(str1\)\?.*\(str2\)\+\(str1\)\?.*\(str2\)\+
// \1 代表 \(str1\)\? ,相当于字符串分组str1
// \2 代表 \(str2\)\+ ,相当于字符串分组str2
//表示把字符串分组str1整体当作一个参考,在 .* 后必须出现一模一样的字符串分组str1
//表示把字符串分组str2整体当作一个参考,在 .* 后必须出现一模一样的字符串分组str2
//分组的匹配结果必须一样
^\<\(word\)\>.*\1$
//等价写法: ^\<\(word\)\>.*\<\(word\)\>$
// \1 代表 \<\(word\)\> ,相当于字符串分组str
//表示把单词word当作一个参考,在 .* 后必须出现一模一样的单词word
//在grep视角,
字母、数字、下划线:都属于单词的一部分
其他字符:视为单词的分隔符
//分组的匹配结果必须一样
a\|b          //表示字符a或者字符b
^\(str1\|str2\)

//表示以字符串str1或者字符串str2作为行首

-EOF-

本文来自投稿,不代表Linux运维部落立场,如若转载,请注明出处:http://www.178linux.com/95429

(0)
M30-Alvin阿峰M30-Alvin阿峰
上一篇 2018-04-08
下一篇 2018-04-08

相关推荐