Linux的文本处理工具之sed的使用

Sed文本处理工具

一、认识sed工具:

sed是一种流编辑器,一次处理一行内容。当进行处理时,把当前处理的行存储在临时的缓冲区中(俗称“模式空间”)后,再用sed命令去处理缓冲区的内容,最后把处理过的缓冲区内容送往屏幕打印显示。接着处理下一行,不断重复进行读取、处理、输出,直到文件末尾。 

注:sed命令处理文本,文件内容本身并没有改变,除非你使用重定向存储输出。Sed主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序等 

二、使用man帮助了解sed的使用格式和常用的选项(#man sed):

NAMEsed的介绍)

sed – stream editor for filtering and transforming text 

SYNOPSISsed的格式使用)

sed [OPTION]… {script-only-if-no-other-script} [input-file]…

注:“script”为‘地址命令’ 

DESCRIPTIONsed的常用选项,如下挑选的选项使用上比较多,其他选项请查阅man帮助)

-n, –quiet, –silent  静默模式,不将模式空间内容输送到屏幕上打印。

suppress automatic printing of pattern space 

-e script, –expression=script   多点编辑。

add the script to the commands to be executed 

-f script-file, –file=script-file 从指定的文件中读取已经编辑好的脚本。

add the contents of script-file to the commands to be executed

–follow-symlinks

follow symlinks when processing in place 

-i[SUFFIX], –in-place[=SUFFIX]   在原文本处编辑(此处选项不建议使用,如果实在是要在原处编辑,请做好数据备份后再操作,以免数据的丢失。)

edit files in place (makes backup if SUFFIX supplied) 

-r, –regexp-extended  支持扩展正则表达式的使用。

use extended regular expressions in the script.

三、了解sed的简单编辑命令以及高级编辑命令:

1、  简单编辑命令:

d: 删除模式空间匹配的行

p: 显示模式空间中的内容

a \text:在行后面追加文本;支持使用\n实现多行追加

i \text:在行前面插入文本;支持使用\n实现多行插入

c \text:替换行为单行或多行文本

w /path/to/somefile :保存模式匹配的行至指定文件

r /path/from/somefile:读取指定文件的文本至模式空间中匹配到的行后

= :为模式空间中的行打印行号

! :模式空间中匹配行取反处理

2、  高级编辑命令:

高级编辑命令:

h: 把模式空间中的内容覆盖至保持空间中

H:把模式空间中的内容追加至保持空间中

g: 从保持空间取出数据覆盖至模式空间

G:从保持空间取出内容追加至模式空间

x: 把模式空间中的内容与保持空间中的内容进行互换

n: 读取匹配到的行的下一行覆盖至模式空间

N:追加匹配到的行的下一行至模式空间

d: 删除模式空间中的行

D:删除当前模式空间开端至\n的内容(不在传至标准输出),放弃之后的命令,但是对剩余模式空间重新执行sed

四、上面了解到sed是文本行处理的流编辑器,那么sed是如何定位要修改的内容呢?那么下面一起来学习sed的地址定界和查找替换:

1、地址定界:

(1) 不给地址:对全文进行处理。

(2) 单地址:

#: 指定的行

/pattern/:被此处模式所能够匹配到的每一行(模式空间)。

(3) 地址范围:

#,#    指定从第几行开始到第几行结束进行处理。

#,+#   指定从第几行开始,往后需要处理多少行。

/pat1/,/pat2/   模式空间定界。指定从第一个被模式空间匹配到开始,直至到被第二个模式空间匹配到结束来进行处理。

#,/pat1/   指定行与模式空间的配合使用;指定从第几行开始,到被模式空间匹配到的行进行处理。

(4) ~:步进

1~2 奇数行  只处理文本内容中的奇数行

2~2 偶数行  只处理文本内容中的偶数行

如下图:分别将文本内容中的奇数行或者偶数行删除掉

blob.png

2、查找与替换:

s///:查找替换,支持使用其它分隔符,如:s@@@s### 

替换标记:

g: 是行内全局替换

p: 将显示替换成功的行

w /PATH/TO/SOMEFILE:将替换成功的行保存至文件中 

学习了上面的理论讲述,下面进行相应的事例演示:

1、简单编辑命令的使用:

sed ‘2p’ /etc/passwd  打印文本内容中的第二行并把文本的原内容一起输送到屏幕显示,可结合静默模式的选项-n配合使用(如下一事例题)

blob.png

sed -n ‘2p’ /etc/passwd

blob.png

sed -n ‘1,4p’ /etc/passwd 在屏幕上打印显示文本内容中的第一行到第四行的内容。

blob.png

sed -n ‘/root/p’ /etc/passwd 只打印显示被模式空间匹配到的行

blob.png

sed -n ‘2,/root/p’ /etc/passwd 2行开始,到被模式空间匹配到之间的所有行

blob.png

sed -n ‘/^$/=’ /testdir/issue 显示空行行号(如下图,原文本中第三行为空行)

blob.png

sed -n -e ‘/^$/p’ –e ‘/^$/=’ /testdir/issue 打印空行的行号和空行;多点编辑

blob.png

sed ‘/root/a\superman’ /etc/passwd  在被模式空间匹配到的行后新增一行打印Superman

blob.png

sed ‘/root/i\superman’ /etc/passwd  在被模式空间匹配到的行前新增一行打印Superman

blob.png

sed ‘/root/c\superman’ /etc/passwd  将被模式空间匹配到的行全部替换成了Superman

blob.png

sed ‘/^$/d’ /testdir/issue   将文本中的空行全部删除掉

blob.png

sed ‘1,10d’ /testdir/passwd 将文本中的前十行删除掉,只打印显示剩余的行

blob.png

nl /etc/passwd| sed‘2,5d’ 给文本加以显示行号,并删除第二行到第五行的内容

blob.png

nl/ etc/passwd| sed‘2a tea’  给文本加以显示行号,并给第二行后新增一行插入单词tea

blob.png

sed 's/nologin/csh/g' /testdir/passwd  在文本中全局查找nologin,并将其替换成csh

blob.png

sed -n‘s/root/&superman/p’ /etc/passwd在被模式空间匹配到的单词后面增加Superman

blob.png

sed -n‘s/root/superman&/p’ /etc/passwd 在被模式空间匹配到的单词前面增加Superman

blob.png

2、高级编辑命令的使用:

sed -n 'n;p' /testdir/ff  打印偶数行

blob.png

sed '1!G;h;$!d' /testdir/ff  逆序显示

blob.png

sed '$!N;$!D' /testdir/ff 打印最后两行

blob.png

sed '$!d' /testdir/ff 打印最后一行

blob.png

sed ‘G’ /testdir/ff  打印所有的行,并在每一行的后面增加一个空行

blob.png

# sed 'g' /testdir/ff 打印空白行

blob.png

sed -n '1!G;h;$p' /testdir/ff  同样是逆序打印

blob.png

# sed '/^$/d;G' /testdir/ff 

blob.png

原创文章,作者:Aaron_wang,如若转载,请注明出处:http://www.178linux.com/32037

(0)
Aaron_wangAaron_wang
上一篇 2016-08-10
下一篇 2016-08-10

相关推荐

  • Linux中的分区管理

    1. 磁盘分区类型 磁盘分区主要分为两种类型: MBR  MBR是一个比较古老的分区类型了,不支持2TB的大硬盘。在磁盘的0磁道0扇区的512字节存放的就是MBR的信息。前446字节为bootloader,后面64字节存放的是分区表,后面2字节存放的是55aa的分区标识符。MBR分区类型最多只能支持4个主分区和扩展分区,其余的分区只能是逻辑分区。 …

    2017-04-22
  • find 和 压缩工具

    find命令 一、find命令基本介绍 1、find作用 通过遍历指定路径实时查找符合条件的文件。 find工作特点 2、find工作特点 查找速度较慢 精确查找 实时查找 用户只能搜索有读取和执行权限的目录 3、语法 find [OPTIONS]… [查找路径] [查找条件] [处理方式] 查找路径:指定…

    Linux干货 2016-08-16
  • python面向对象第二周魔术方法详解

    魔法方法及其使用__开头和结束的方法,定义外部没有办法直接调用,但会有影响使用运算符号的魔法方法, + ,-,*,/,%,//,**, __add__,__sub__,__mul__,__truediv__,__mod__,__floordiv__,__pow__,__divmod__(?),系统内部对于数值型,字符串型,容器内型都定义了其中部分或者全部的运…

    Linux干货 2017-11-22
  • Linux 文件系统上的权限

    文件系统上的权限是指文件系统上的文件和目录的权限,由于Linux是一种多用户的操作系统,而且允许同一时间登录多个用户操作,所以我们就需要一定的管理机制来对限定不同用户对同一文件或目录的操作权限。 文件系统上的权限主要针对三类对象(访问者)进行定义: owner:属主 u; g 属组 group; o: 其它 other 每个文件针对每类访问者都定义了三种权限…

    2017-06-04
  • CentOS6 网卡bonding

    Bonding ;理念 将多块网卡绑定同一IP地址对外提供服务,可以实现高可用 或者负载均衡。直接给两块网卡设置同一IP地址是不可以的 。通过bonding,虚拟一块网卡对外提供连接,物理网卡的 被修改为相同的MAC地址 banding工作模式 Mode 0 (balance-rr) 轮转(Round-robin)策略: 从头到尾顺序的在每一个slave 接…

    Linux干货 2017-11-24
  • pam_mysql认证ftp虚拟用户账号,且拥有不同的权限

    关防火墙:#systemctl stop firewalld                #setenforce 0 #yum install mariadb.server #yum install mariadb-d…

    Linux干货 2017-06-07

评论列表(1条)

  • 马哥教育
    马哥教育 2016-08-10 10:43

    架构清晰,思路清晰,有理论有时间。排版需要改进,对小标题或二级标题可以适当的进行一些字体上的调整。