了解sed

本博客分为四个部分:
sed介绍、sed用法、sed高级用法(简略带过)、相关例题。
通过本文可以大致了解sed命令。深度可以当成是课前预习吧。

1、sed介绍
Stream EDitor, 行编辑器
sed是一种流编辑器,它一次处理一行内容。处理时,把 当前处理的行存储在临时缓冲区中,称为“模式空间”( pattern space),接着用sed命令处理缓冲区中的内容 ,处理完成后,把缓冲区的内容送往屏幕。接着处理下一 行,这样不断重复,直到文件末尾。文件内容并没有改变 ,除非你使用重定向存储输出。Sed主要用来自动编辑一 个或多个文件,简化对文件的反复操作,编写转换程序

2、sed用法
sed [option]… ‘script’ inputfile…  

常用选项:
    -n:不输出模式空间内容到屏幕,即不自动打印
    -e: 多点编辑
        注:通过后面例题,个人理解该命令是用来合并多条地址命令的
    -f:/PATH/SCRIPT_FILE: 从指定文件中读取编辑脚本
        注:用来编写复杂的地址命令
    -r: 支持使用扩展正则表达式
    -i.bak: 备份文件并原处编辑
        -i:直接在原处编辑,此选项慎用

script:
    ‘地址命令’

地址定界:
(1) 不给地址:对全文进行处理
        注意:这里不给地址也要有”,不然会出错
(2) 单地址:
        #: 指定的行
        /pattern/:被此处模式所能够匹配到的每一行
(3) 地址范围:
        #,# 第#行到第#行
        #,+# 第#行到其后#行
        /pat1/,/pat2/
        #,/pat1/         
(4) ~:步进
        1~2 奇数行
        2~2 偶数行

 编辑命令:
     d: 删除模式空间匹配的行
     p: 显示模式空间中的内容
     a []text:在指定行后面追加文本 支持使用\n实现多行追加
     i []text:在行前面插入文本
     c []text:替换行为单行或多行文本
     w /path/somefile: 保存模式匹配的行至指定文件
     r /path/somefile:读取指定文件的文本至模式空间中 匹配到的行后
     =: 为模式空间中的行打印行号
     !:模式空间中匹配行取反处理(跟在要取反部分后面)

    s///:查找替换,支持使用其它分隔符,s@@@,s###
    替换标记:
        g: 行内全局替换
        p: 显示替换成功的行

        w /PATH/TO/SOMEFILE:将替换成功的行保存至文件

3、sed高级(danteng)用法
高级编辑命令:
    h: 把模式空间中的内容覆盖至保持空间中
    H:把模式空间中的内容追加至保持空间中
    g: 从保持空间取出数据覆盖至模式空间
    G:从保持空间取出内容追加至模式空间
    x: 把模式空间中的内容与保持空间中的内容进行互换
    n: 读取匹配到的行的下一行覆盖至模式空间 N:读取匹配到的行的下一行追加至模式空间
    d: 删除模式空间中的行
    D:删除当前模式空间开端至\n的内容(不再传至标准输 出),放弃之后的命令,但是对剩余模式空间重新执行sed
    这一部分功能确实很强大,但是不容易记忆、理解和掌握。掌握基本用法才是王道。

    sed -n ‘n;p’ FILE
    sed ‘1!G;h;$!d’ FILE
    sed ‘$!N;$!D’ FILE
    sed ‘$!d’ FILE
    sed ‘G’ FILE
    sed ‘g’ FILE
    sed ‘/^$/d;G’ FILE
    sed ‘n;d’ FILE
    sed -n ‘1!G;h;$p’ FILE
    看懂并会用以上,则sed神功已成。

4、相关例题解答(大部分都没有标准答案,自己尝试写的)
1
删除/boot/grub/grub.conf文件中所有以空白开头的行行首的空白字符
sed “s@^[[:space:]]+@@” /boot/grub/grub.conf 错误解答
sed ‘s@^[[:space:]]+@@ /boot/grub/grub.conf 正解
这里地址命令默认是使用基本正则表达式,需要写成+

2
删除/etc/fstab文件中所有以#开头,后面至少跟一个空白字符的行 的行首的#和空白字符
sed ‘s@^#[[:space:]]+@@’ /etc/fstab
基本正则表达式的用法

3
在centos6系统/root/install.log每一行行首增加#号
sed ‘s@^@#&@’ /root/install.log
经过实验结果正确。
思路:只要匹配到了行首,就在行首之前加上#替换原行首。

4
在/etc/fstab文件中不以#开头的行的开头增加#号
sed ‘s@^[^#]@#&@’ /etc/fstab
和第三题属于同一类型。

5

处理/etc/fstab路径,使用sed命令取出其目录名和基名

讲道理上面已经解决了一个更为复杂的情况

echo /etc/fstab|sed ‘s@[^/]\+$@@’ 取出目录名

echo /etc/fstab|sed ‘s@^/.*/@@’ 取出基名

以上两种方法足以处理给定形式下的路径名。

拓展思考:

可以考虑怎么解决/etc/fstab/形式下的路径。

echo一个绝对路径给sed命令,取出其基名;取出其目录名;

echo /etc/passwd|sed ‘s@[^/]\+\/?$@@’能够应对结尾带/的特殊情况 取出目录名

echo /etc/passwd|sed ‘s@^/[^/]*/@@’不能应对结尾带/的特殊情况 取出基名

随后想到先去掉结尾可能存在的/不就好了。修改后的解答如下:

echo /etc/passwd/|sed ‘s@/\?$@@’|sed ‘s@^/[^/]*/@@’能够应对结尾出现/的特殊情况取出基名

顺便尝试用-e来合并后两部分的地址命令

最终结果如下:

echo /etc/passwd/|sed -e ‘s@/\?$@@;s@^/[^/]*/@@’

6
利用sed取出ifconfig命令中的本机的ipv4地址
ifconfig|sed -n ‘/\<inet\>/p’ 能够取出inet的行
去过要单独取出inet,需要大量后续处理。

7
统计centos安装光盘中package目录下所有rpm文件的以.分隔倒数第二个字段的重复次数
ls /mnt/yum/Packages|grep -o “[^.]+.rpm$”|cut -d”.” -f1|sort|uniq -c

sed方法暂时没有想好。对于使用sed进行数据统计不了解。

这里我尝试用sed -n ‘/[^.]\+\.rpm$/p’代替grep部分,但是结果是错误的。

8
统计/etc/init.d/functions文件中每个单词的出现次数,并排序
grep和sed两种方法分别实现。
不太清楚怎么依次统计所有单词的出现次数。

9
将文本文件的n和n+1行合并为一行,n为奇数行
上网查的方法。讲道理sed的高级用法虽然强大但真的不容易理解。
sed ‘N;s/\n//’ test.txt
N读取匹配到的行的下一行追加至模式空间
s然后是进行替换,把模式空间中的换行符去掉,从而完成两行合并成一行。

原创文章,作者:maru,如若转载,请注明出处:http://www.178linux.com/74250

(0)
marumaru
上一篇 2017-04-25
下一篇 2017-04-25

相关推荐

  • rsync+inotify实现数据实时同步备份

    定时备份和实时备份        说到备份,无疑于定时备份和实时同步备份。定时备份可以通过脚本或者Crontab来实现,而实时同步备份可以通过某些接口监控文件的各种变化情况来实现的(比如内核接口inotify);通过对比可以发现对数据信息要求高的环境使用实时同步备份可以更好更有利的保护数据的安全性。 软件介绍之rsyn…

    Linux干货 2015-02-28
  • nginx负载均衡搭建

    组 网络拓扑图 nginx负载均衡服务器搭建 首先准备三台机器 主机A(nginx负载均衡器) 主机B 主机C 主机A需两块网卡(一块外网,一块内网) 主机B和主机C各一块 (各一块内网的IP,如果主机B C和主机A内网网卡在一个网段就不需要配置网关地址了。 规划好网络后,nginx负载主机分别ping下各rs主机是否可通 主机A打开核心转发功能 #echo…

    Linux干货 2017-05-17
  • Linux系统用户、组

    1、资源分派:          Authentication  认证        Authorization   授权     &nbs…

    Linux干货 2016-08-04
  • 8月9日vim作业

    复制/etc/rc.d/init.d/functions文件至/tmp目录;替换/tmp/functions文件中的/etc/sysconfig/init为/var/log; :%s@/etc/sysconfig@/var/log@ 删除/tmp/functions文件中所有以#开头,且#后面至少有一个空白字符的行的行首的#号 :%s@^#\([[:spac…

    Linux干货 2016-08-10
  • 脚本初学者

    期待已久的脚本终于在这一周学到了,对于脚本,我感觉就是有两点,第一:考验一个人的思维能力,如果能把你想要的结果用脚本正确的表示出来。第二:以前学的基础命令,怎么组合起来使用。达到以上两点,再难写的脚本都可以写出来的。 一、编写,执行一个脚本        脚本的格式  &nbsp…

    2017-08-05
  • Linux文件类型

    Linux文件类型常见的有:普通文件、目录文件、字符设备文件和块设备文件、符号链接文件等。 1、普通文件,颜色为白色 纯文本档 二进制文件 数据格式文件 2、目录文件,颜色为蓝色 当我们在某个目录下执行,看到有类似 drwxr-xr-x ,这样的文件就是目录,目录在Linux是一个比较特殊的文件。首字符是【d】字母。 3、字符设备和块设备…

    Linux干货 2016-10-16

评论列表(1条)

  • renjin
    renjin 2017-04-28 09:39

    对sed命令进行了介绍 ,内容写的很详细,注意一下排版,你的那个代码块还是没有注意到,下次要注意一些。