sed 高级用法(1) 之 n N

前言

我在参考其它多个Blog中发现,有些Blog中sed的功能介绍和实际有出入,这可能和版本有关系,正如sed文档中所说“might change in future versions”,所以本文sed是以4.2.1为例。如果以后sed更新版本了,有可能会不一样。

好记性不如烂笔头!

sed的工作原理

sed维护着两个数据的缓冲空间,一个是模式空间(pattern space)和另外一个保留空间(hold space),在初始环境下都为空。

sed是一个流编辑器,它会循环的从输入流中读取每一行,直到读完整个文件。具体如下:

首先,它会从输入流中读取一行(如果刚开始就是第一行),移除行尾的换行符,放置于模式空间当中,接着一条条的运行命令(命令可以有多个并且是按序执行,如果某个命令地址定界了一个行号,只有满足该行号才会执行命令,如“1d”,意思是如果是第一行则删除模式空间内的内容)。

当命令运行完毕之后,除非使用了 -n 选项,否则会把模式空间的内容加上之前删过的换行符并打印到输出。然后读入下行,执行下一个循环。如果没有使诸如‘D’的特殊命令,那会在两个循环之间清空模式空间,但不会清空保留空间。

意译自http://www.gnu.org/software/sed/manual/sed.html中 3.1 How sed Works

流程图如下

sed 工作原理.jpg

注:上面只是标准流程,某些特殊命令会有自己的流程


n N的说明

范例文件1

[root@CZ tmp]# cat 1
1
2
3
4
5
6
7
8
9
10
11

 

n:打印当前模式空间内容,然后读取下一行并替代当前模式空间的内容。如果读取不到下一行sed则会不运行之后的命令

我们通过以下命令了解一下n

[root@CZ tmp]# sed 'n;d' 1
1
3
5
7
9
11

上面命令过程是这样

  1. 先读取第一行进模式空间(以后简称为1)

  2. 执行命令n,过程如下

    1. 打印1到输出

    2. 读取2并覆盖到模式空间

  3. 执行命令d,过程如下

    1. 删除模式空间的内容

    2. 立即执行下一循环(d命令在运行后会直接执行下一循环,所以它并不会执行之后的命令和打印模式空间,具体d介绍会留在下次分享)

  4. 按照上面的流程循环执行…….直到读取到11(最后一行),11的具体过程如下

    1. 读取11进模式空间

    2. 运行命令n,不过读取不到下一行

    3. 因为读不到,所以sed退出所有的命令,也就是说它不会执行命令d

    4. 加回换行符并打印模式空间的内容到输出,当前模式空间内容为11,所以输出11

  5. 已经是文件尾,sed结束运行。 

 

N:读取下一行并且附加到当前模式空间内,如果读取不到下一行sed则会不运行之后的命令

我们通过以下命令了解一下N

[root@CZ tmp]# sed 'N;a---' 1
1
2
---
3
4
---
5
6
---
7
8
---
9
10
---
11

上面命令过程是这样

  1. 读取1进模式空间

  2. 执行命令N

    1. 读取2并附加到模式空间,当前模式空间内容为“1\n2”

  3. 执行命令a—

    1. 在模式空间后附加一行‘—’当前模式空间内容为“1\n2\n—"

  4. 打印模式空间内容

  5. 循环执行直到读取11进模式空间,11的具体过程如下

    1. 读取11进模式空间

    2. 执行命令N,不过读取不到下一行

    3. 因为读不到,所以sed退出所有的命令,也就是说它不会执行命令a

    4. 加回换行符并打印模式空间的内容到输出,当前模式空间内容为11,所以输出11

  6. 已经是文件尾,sed结束运行。 

尾言

n N经常和d D一起用,不过D有点复杂,所以留在下次分享,不过我先剧透一下,D会删除模式空间内第一行,并且如果模式空间内容不为空,它会循环执行前面命令。直到为空才会执行下一循环。


参考

http://www.gnu.org/software/sed/manual/sed.html

上面是官方文档,如果下面和上面冲突,请以上面为准,下面blog有些内容和我理解有出入,请自行判断。

http://www.cnblogs.com/fhefh/archive/2011/11/14/2248942.html

http://www.cnblogs.com/theCambrian/p/3606214.html    
http://blog.csdn.net/yanquan345/article/details/19613443

http://www.cnblogs.com/fhefh/archive/2011/11/22/2259097.html


 

原创文章,作者:Unknown,如若转载,请注明出处:http://www.178linux.com/5900

(0)
UnknownUnknown
上一篇 2015-07-03
下一篇 2015-07-03

相关推荐

  • 马哥linux 0726作业

    1,课堂练习 显示当前日期,格式:2016-08-08 显示前天是星期几 设置当前日期为2008-08-08 08:00 使用字符端登陆时,显示当前登录终端号,主机名和当前时间 1,首先我们知道当前登录信息的配置文件在/etc/issue中 2,然后我们查询帮助看看issue的具体描述查到了相关的mingetty的命令当中关于当中的一些选项就是我们需要的三个…

    Linux干货 2016-08-04
  • MariaDB安装与配置

    MariaDB安装与配置  本文是基于CentOS7.2系统来进行mariadb的安装与配置,安装前请关闭selinux和在iptables规则中开放3306端口,在此次我们直接清空了iptables规则。 Iptables –F vim /etc/selinux/config #SELINUX=enforcing ##注释掉此项## #SELIN…

    Linux干货 2017-02-18
  • 第九周

    统计可登录shell与不能登陆shell的个数 2. 写一个脚本 3.写一个脚本    4、写一个脚本,完成如下功能 脚本能够接受一个参数。 (1) 如果参数1为quit,则显示退出脚本,并执行正常退出。 (2) 如果参数1为yes,则显示继续执行脚本。 (3) 否则,参数1为其它任意值,均执行非正常退出。    5、…

    Linux干货 2016-12-26
  • Shell脚本编程之入门基础(二)if、case的使用

    Shell编程之条件选择和条件判断   一、条件选择(if)与条件判断(case)的对比: if语句:是选择执行,if语句可嵌套。 if条件选择使用格式 单分支 双分支 多分支 if 判断条件;then 条件为真的分支代码 fi if 判断条件; then 条件为真的分支代码 else 条件为假的分支代码 fi if CONDITION1; the…

    Linux干货 2016-08-15
  • 十四.Linux博客-2016年8月22日数组

    格式说明: 操作 概念 命令 说明及举例 十四.数组 数组概念 变量:存储单个元素的内存空间数组:存储多个元素的连续的内存空间,相当于多个变量的集合。数组名和索引索引:编号从0开始,属于数值索引注意:索引可支持使用自定义的格式,而不仅是数值格式,即为关联索引,bash4.0版本之后开始支持。bash的数组支持稀疏格式(索引不连续) 声明数组declare -…

    Linux干货 2016-08-24
  • 网络基础

    网络小白一个,针对网络的基础知识无从下手,因此本文引用了鸟哥私房菜中的众多概念性知识,在此谢过,本文主要从OSI七层协议,TCP协议和一些网络中专业词汇进行解析,并通过子网掩码的划分,网络接口的配置、路由配置等实例来加深对网络的理解。 一、OSI七层协议:     OSI七层协议的由来:   由于网络链接过程…

    Linux干货 2016-09-07