前言
我在参考其它多个Blog中发现,有些Blog中sed的功能介绍和实际有出入,这可能和版本有关系,正如sed文档中所说“might change in future versions”,所以本文sed是以4.2.1为例。如果以后sed更新版本了,有可能会不一样。
好记性不如烂笔头!
sed的工作原理
sed维护着两个数据的缓冲空间,一个是模式空间(pattern space)和另外一个保留空间(hold space),在初始环境下都为空。
sed是一个流编辑器,它会循环的从输入流中读取每一行,直到读完整个文件。具体如下:
首先,它会从输入流中读取一行(如果刚开始就是第一行),移除行尾的换行符,放置于模式空间当中,接着一条条的运行命令(命令可以有多个并且是按序执行,如果某个命令地址定界了一个行号,只有满足该行号才会执行命令,如“1d”,意思是如果是第一行则删除模式空间内的内容)。
当命令运行完毕之后,除非使用了 -n 选项,否则会把模式空间的内容加上之前删过的换行符并打印到输出。然后读入下行,执行下一个循环。如果没有使诸如‘D’的特殊命令,那会在两个循环之间清空模式空间,但不会清空保留空间。
意译自http://www.gnu.org/software/sed/manual/sed.html中 3.1 How sed Works
流程图如下
注:上面只是标准流程,某些特殊命令会有自己的流程
n N的说明
范例文件1
[root@CZ tmp]# cat 1 1 2 3 4 5 6 7 8 9 10 11
n:打印当前模式空间内容,然后读取下一行并替代当前模式空间的内容。如果读取不到下一行sed则会不运行之后的命令
我们通过以下命令了解一下n
[root@CZ tmp]# sed 'n;d' 1 1 3 5 7 9 11
上面命令过程是这样
-
先读取第一行进模式空间(以后简称为1)
-
执行命令n,过程如下
-
打印1到输出
-
读取2并覆盖到模式空间
-
执行命令d,过程如下
-
删除模式空间的内容
-
立即执行下一循环(d命令在运行后会直接执行下一循环,所以它并不会执行之后的命令和打印模式空间,具体d介绍会留在下次分享)
-
按照上面的流程循环执行…….直到读取到11(最后一行),11的具体过程如下
-
读取11进模式空间
-
运行命令n,不过读取不到下一行
-
因为读不到,所以sed退出所有的命令,也就是说它不会执行命令d
-
加回换行符并打印模式空间的内容到输出,当前模式空间内容为11,所以输出11
-
已经是文件尾,sed结束运行。
N:读取下一行并且附加到当前模式空间内,如果读取不到下一行sed则会不运行之后的命令
我们通过以下命令了解一下N
[root@CZ tmp]# sed 'N;a---' 1 1 2 --- 3 4 --- 5 6 --- 7 8 --- 9 10 --- 11
上面命令过程是这样
-
读取1进模式空间
-
执行命令N
-
读取2并附加到模式空间,当前模式空间内容为“1\n2”
-
执行命令a—
-
在模式空间后附加一行‘—’当前模式空间内容为“1\n2\n—"
-
打印模式空间内容
-
循环执行直到读取11进模式空间,11的具体过程如下
-
读取11进模式空间
-
执行命令N,不过读取不到下一行
-
因为读不到,所以sed退出所有的命令,也就是说它不会执行命令a
-
加回换行符并打印模式空间的内容到输出,当前模式空间内容为11,所以输出11
-
已经是文件尾,sed结束运行。
尾言:
n N经常和d D一起用,不过D有点复杂,所以留在下次分享,不过我先剧透一下,D会删除模式空间内第一行,并且如果模式空间内容不为空,它会循环执行前面命令。直到为空才会执行下一循环。
参考
http://www.gnu.org/software/sed/manual/sed.html
上面是官方文档,如果下面和上面冲突,请以上面为准,下面blog有些内容和我理解有出入,请自行判断。
http://www.cnblogs.com/fhefh/archive/2011/11/14/2248942.html
http://www.cnblogs.com/theCambrian/p/3606214.html
http://blog.csdn.net/yanquan345/article/details/19613443
http://www.cnblogs.com/fhefh/archive/2011/11/22/2259097.html
原创文章,作者:Unknown,如若转载,请注明出处:http://www.178linux.com/5900