Linux学习总结及练习&day08-sed文本处理工具

第一部分、Linux文本处理三剑客之sed(Stream EDitor)文本编辑工具

    一、sed的基本功能工作原理

    sed是一种流编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出。sed默认只要被模式匹配到不管有没有编辑(edit)都会有标准输出(stdout),因此我们常用-n选项搭配使用。 Sed主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序等。

    

1.png

 二、sed命令的常用选项

    sed [OPTION]… 'scripts' [input-file]…

        scripts:地址定界编辑命令

    常用选项:

        -n:不输出模式空间中的内容至屏幕

        -e:支持多条命令执行,意味多点编辑

        -f /PATH/TO/SCRIPT_FILE: 从指定文件中读取编辑脚本(每行一个编辑命令)
        -r: 支持使用扩展正则表达式
        -i: 直接编辑原文件(不建议使用,一旦修改,删了就找不回来了,通常使用-i.bak来备份)

三、sed命令的地址定界

        (1) 不给地址:(空地址)对全文进行处理

        (2) 单地址:
                #: 指定的行
                /pattern/:被此处模式所能够匹配到的每一行
  

        (3) 地址范围:
                #,#               从第#行到第#行中间的行
                #,+#              从第#行到第#+#行中间的行
                /pat1/,/pat2/     从模式part1匹配到的行开始到被模式part2匹配到行的中间行

                #,/pat1/          从第#行开始到被模式part1匹配到中间的行

        (4) ~:步进
                1~2 奇数行
                2~2 偶数行

四、sed常用的编辑命令

       d命令: 删除模式空间匹配的行

            举例子:

                1、sed  '1,5d' /etc/fstab   删除/etc/fstab文件的第1行到第5行

                2、sed  '3d' /etc/fstab     删除/etc/fstab文件的第3行

                3、sed  '/^#/d' /etc/fstab  删除/etc/fstab文件#开头的行

                4、sed  '1~2d' /etc/fstab   删除/etc/fstab文件的中的奇数行显示偶数行

        p命令: 显示模式空间中的内容(显示模式匹配到的行)

            举例子:

                1、sed  '1~2p’ /etc/fstab  会显示两次奇数行(默认匹配到会有一次输出)

                2、sed  -n '1~2p’ /etc/fstab 禁止默认的输出,仅显示一次奇数行

        a命令:a \text:在行后面追加文本;支持使用\n实现多行追加

        i命令:i \text:在行前面插入文本;支持使用\n实现多行插入

            举例子:

                1、sed  '3i \new line’ /etc/fstab  在/etc/fstab文件的第三行前面插入new line字段(其                                                     它默认输出)

                2、sed  '3a \new line’ /etc/fstab  在/etc/fstab文件的第三行后面追加new line字段(其                                                     它默认输出)

            支持文本多行显示:

                3、sed  '3a \new line\n another new line’ /etc/fstab  

                在/etc/fstab文件的第三行后面追加new line和another new line字段的两行

                4、sed  '/^UUID/a \#add new device base on UUID’ /etc/fstab

                在/etc/fstab文件的以UUID开头的行后面添加#…..后面的备注信息

        c命令:c \text:把匹配到的行替换成此处指定的文本“text”整行替换

            举例子:

                1、sed  '/^UUID/c \#add new device base on UUID’ /etc/fstab

                在/etc/fstab文件的以UUID开头的行均被替换为#…..上面的字符

        w:w /path/to/somefile: 保存模式空间匹配的行至指定文件

            举例子:

                第一步: sed -n '/^[^#]/p ' /etc/fstab

                 将以非#号开头的行显示出来

                第二步: sed  '/^[^#]/w /tmp/fstab.new' /etc/fstab

                 将非#开头的行写到文件/tmp/fstab.new文件中

        

        r:r /path/from/somefile:读取指定文件的文本至模式空间中匹配到的行后

            举例子:

                1、sed '3r /etc/issue' /etc/fstab

                 在/etc/fstab的第三行后面加入/etc/issue中文件的内容

            

       =命令: =为模式空间中的行打印行号

            举例子:

                1、sed '/^UUID/=' /etc/fstab

                 在/etc/fstab文件中以UUID开头的行,另外换行加入行号

        !命令: 模式空间中匹配行取反处理

            举例子:

                1、sed '/^#/!d' /etc/fstab   删除不以#开头的行

        s命令: s/// 查找替换,其分隔符可自行指定s@@@或s$$$等

            替换标记:       

                g: 行内全局替换
                p: 显示替换成功的行
                w /PATH/TO/SOMEFILE:将替换成功的行保存至文件中

五、sed命令使用示例

  • sed ‘2p’ /etc/passwd                    显示/etc/passwd文件第二行两次                         

  • sed –n ‘2p’ /etc/passwd                显示/etc/passwd文件第二行

  • sed –n ‘1,4p’ /etc/passwd              显示/etc/passwd文件第1到4行

  • sed –n ‘/root/p’ /etc/passwd           显示/etc/passwd文件匹配到root字符的行

  • sed –n ‘2,/root/p’ /etc/passwd         显示该文件从2行开始到匹配到含有root字符的行中间的行

  • sed -n ‘/^$/=’ file                     显示该文件空行行号

  • sed –n –e ‘/^$/p’ –e ‘/^$/=’ file  显示该文件空行并且打印其空行的行号

  • sed ‘/root/a\superman’ /etc/passwd      在该文件匹配到root字符行的行后(换行)加上superman字段

  • sed ‘/root/i\superman’ /etc/passwd      在该文件匹配到root字符行的行前(换行)插入superman字段

  • sed ‘/root/c\superman’ /etc/passwd      把该文件匹配到root字符行(整行)替换成superman字段的行

  • sed ‘/^$/d’ file                        删除该文件中的空白行

  • sed ‘1,10d’ file                        删除该文件中的第1到10行

  • nl /etc/passwd | sed ‘2,5d’             删除/etc/passwd文件中的第2到5行

  • nl /etc/passwd | sed ‘2a\tea’           在/etc/passwd文件的第2行后(换行)追加tea字段的行

  • sed 's/test/mytest/g' example             全局将test字符串替换为mytest字符串

  • sed –n‘s/root/&superman/p’ /etc/passwd 匹配到该文件含有root的行,并在root后面添加superman

  • sed –n‘s/root/superman&/p’ /etc/passwd 匹配到该文件含有root的行,并在root前面添加superman

  • sed -e ‘s/dog/cat/’ -e ‘s/hi/lo/’pets 匹配该文件含有dog和hi的行,并将其字符替换为cat和lo

  • sed –i.bak ‘s/dog/cat/g’ pets          全局将含有dog的行中的dog字符串替换为cat,且在原文上修                                             改,并且生成pets.bak的备份文件(未修改的原文件)

六、sed命令相关练习

  

    #1、删除/etc/grub2.conf文件中所有以空白开头的行行首的空白字符
    
        sed -r 's@^[[:space:]]+@@' /etc/grub2.cfg
        
[root@localhost ~]# sed -r 's@^[[:space:]]+@@' /etc/grub2.cfg
#
# DO NOT EDIT THIS FILE
#
# It is automatically generated by grub2-mkconfig using templates
# from /etc/grub.d and settings from /etc/default/grub
#

### BEGIN /etc/grub.d/00_header ###
set pager=1

if [ -s $prefix/grubenv ]; then
load_env
fi
if [ "${next_entry}" ] ; then
set default="${next_entry}"
set next_entry=
save_env next_entry
set boot_once=true
else
set default="${saved_entry}"
fi

if [ x"${feature_menuentry_id}" = xy ]; then
menuentry_id_option="--id"
else
menuentry_id_option=""
fi

export menuentry_id_option        

    #2、删除/etc/fstab文件中所有以#开头,后面至少跟一个空白字符的行的行首的#和空白字符
        
        sed 's@^#[[:space:]]\+@@' /etc/fstab

[root@localhost ~]# sed 's@^#[[:space:]]\+@@' /etc/fstab

#
/etc/fstab
Created by anaconda on Sun Jul 24 11:42:46 2016
#
Accessible filesystems, by reference, are maintained under '/dev/disk'
See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info
#
UUID=bd6898a4-e81d-484f-a98c-bf0db692a30b /                       xfs     defaults        0 0
UUID=cfa0ba95-faf2-41ed-a849-70c59f56e00a /boot                   xfs     defaults        0 0
UUID=b1c4ae19-2384-4e09-bea7-2f1cffaa3dcb /testdir                xfs     defaults        0 0
UUID=4c2a179a-61d4-4a7f-91f0-15979fc699f2 swap                    swap    defaults        0 0


    #3、在/root/install.log每一行行首增加#号
    
        sed -r 's@(.*)@#\1@g' /root/install.log
        
        或者sed  's@^@#@' /root/install.log
        
[root@centos6 testdir]# sed -r 's@(.*)@#\1@g' /root/install.log
#Installing ql2100-firmware-1.19.38-3.1.el6.noarch
#Installing ivtv-firmware-20080701-20.2.noarch
#Installing libertas-usb8388-firmware-5.110.22.p23-3.1.el6.noarch
#Installing xorg-x11-drv-ati-firmware-7.6.1-2.el6.noarch
#Installing ql2500-firmware-7.03.00-1.el6_5.noarch
#Installing atmel-firmware-1.3-7.el6.noarch
#Installing zd1211-firmware-1.4-4.el6.noarch
#Installing iwl4965-firmware-228.61.2.24-2.1.el6.noarch
#Installing rt61pci-firmware-1.2-7.el6.noarch
#Installing iwl3945-firmware-15.32.2.9-4.el6.noarch
#Installing ql2200-firmware-2.02.08-3.1.el6.noarch
#Installing rt73usb-firmware-1.8-7.el6.noarch
#Installing ipw2100-firmware-1.3-11.el6.noarch
#Installing ql23xx-firmware-3.03.27-3.1.el6.noarch
#Installing ipw2200-firmware-3.1-4.el6.noarch
#Installing rootfiles-8.1-6.1.el6.noarch
#Installing man-pages-3.22-20.el6.noarch
#Installing words-3.0-17.el6.noarch
#*** FINISHED INSTALLING PACKAGES ***[root@centos6 testdir]# 
        
    #4、在/etc/fstab文件中不以#开头的行的行首增加#号
            
            sed 's@^[^#].*@#&@' /etc/fstab
            
[root@centos6 testdir]# sed 's@^[^#]@#&@' /etc/fstab

#
# /etc/fstab
# Created by anaconda on Mon Jul 25 01:30:22 2016
#
# Accessible filesystems, by reference, are maintained under '/dev/disk'
# See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info
#
#UUID=eb1a1164-fb03-45f1-8b2d-9d046d3e228b /                       ext4    defaults        1 1
#UUID=439d1457-04f7-4069-b3ac-04e77c29543c /boot                   ext4    defaults        1 2
#UUID=b7bff15d-cd5e-4be3-ace6-22c688569b26 /testdir                ext4    defaults        1 2
#UUID=3a2ca217-2ea4-48f2-8294-55495b01c3a9 swap                    swap    defaults        0 0
#tmpfs                   /dev/shm                tmpfs   defaults        0 0
#devpts                  /dev/pts                devpts  gid=5,mode=620  0 0
#sysfs                   /sys                    sysfs   defaults        0 0
#proc                    /proc                   proc    defaults        0 0


    #5、处理/etc/fstab路径,使用sed命令取出其目录名和基名
          
        echo /etc/sysconfig/ |sed -r  's#[^/]+/?$##'           目录名
        
        echo "/etc/fst/sd" | sed   -r 's@(.*/)([^/]+/?)$@\1@'  目录名

        echo "/etc/fstab/" | sed 's@^.*\<@@'                   基名
        
[root@centos6 ~]# echo /etc/sysconfig/ |sed -r  's#[^/]+/?$##'
/etc/
[root@centos6 ~]# echo "/etc/fst/sd" | sed   -r 's@(.*/)([^/]+/?)$@\1@'
/etc/fst/
[root@centos6 ~]# echo "/etc/fstab/" | sed 's@[^/]\+/\?$@@'
/etc/
[root@centos6 ~]# echo "/etc/fstab/" | sed 's@^.*\<@@'
fstab/

    #6、利用sed 取出ifconfig命令中本机的IPv4地址
    
        ifconfig|sed -n 2p |sed -r  's/.*addr:(.*)  Bca.*/\1/'
        
        或者ifconfig|sed -n 2p |sed -e  's/.*addr://' -e 's/ B.*//'
        
        或者ifconfig|sed -n 2p |sed -r  's/.*addr:(.*)  Bca.*/\1/'
        
[root@centos6 ~]# ifconfig|sed -n 2p |sed -r  's/.*addr:(.*)  Bca.*/\1/'
172.18.18.203
[root@centos6 ~]# ifconfig|sed -n 2p |sed -e  's/.*addr://' -e 's/ B.*//'
172.18.18.203 
[root@centos6 ~]# ifconfig|sed -n 2p |sed -r  's/.*addr:(.*)  Bca.*/\1/'
172.18.18.203

    #7、统计centos安装光盘中Package目录下的所有rpm文件的以.分隔倒数第二个字段的重复次数
    
[root@centos6 ~]# ls  /media/CentOS_6.8_Final/Packages |grep -v '.*.rpm'
TRANS.TBL
        
        由于该文件夹下面的文件有以TRANS.TBL结尾的文件,因此需要滤除
        
        ls  /media/CentOS_6.8_Final/Packages |grep -o '.*.rpm' |sed -r 's#.*\.(.*)\.rpm$#\1#'|sort  |uniq -c
        
[root@centos6 ~]# ls  /media/CentOS_6.8_Final/Packages |grep -o '.*.rpm' |sed -r 's#.*\.(.*)\.rpm$#\1#'|sort  |uniq -c
      4 i686
    919 noarch
   2283 x86_64
   
    或者ls  /media/CentOS_6.8_Final/Packages |grep -o '.*.rpm' |rev |cut -d. -f2 |rev|sort |uniq -c
    
[root@centos6 ~]# ls  /media/CentOS_6.8_Final/Packages |grep -o '.*.rpm' |rev |cut -d. -f2 |rev|sort |uniq -c
      4 i686
    919 noarch
   2283 x86_64

原创文章,作者:AndyIvanXue,如若转载,请注明出处:http://www.178linux.com/32099

(0)
AndyIvanXueAndyIvanXue
上一篇 2016-08-10
下一篇 2016-08-10

相关推荐

  • Linux终端类型

    前言 终端是一个很重要的外设,用过终端设备的人都知道如果设备类型不对就会有乱字符,也可用仿真终端软件如netterm试验一下,Linux的终端信息放在 /usr/share/terminfo下,在这个目录的子目录v下就有许多的如vt100,vt102,vt200等,看一下就知道了。 终端类型的区别与概念 1、 pty(虚拟终端): 但是如果我们远程telne…

    Linux干货 2016-10-14
  • 学习笔记–文本处理工具

    Linux下有很多文本处理工具,本文将介绍几款比较常用的文本处理工具,比如对文本查看的工具:cat和less,文本截取工具:head和tail,按列抽取文本工具:cut,按关键字查询文本工具:grep,下面将具体介绍各种工具的使用。 1、文本查看命令cat 用法: cat [OPTION]… [FILE]… cat命令一次性…

    Linux干货 2016-08-07
  • Linux文件权限管理及目录文件的深入理解。

    文件权限及目录 初学Linux,感觉这个东西该复杂,而且逻辑非常的强。难~! 自己根据学习到的理论和实践,得出的对文件权限,进程,以及特殊权限的深入理解。希望能解决初学者对于权限的困惑。如有错误请指正。 文件的权限,指定的是什么? 是文件的权限位上的权限,针对三类用户,任何用户都必须是三类用户中的一种,属主属组和其他人的权限rwx   &…

    Linux干货 2016-08-10
  • 关于取路径名与基名的探讨和扩展-20160806

                          关于取路径名与基名的探讨和扩展     这两天学习grep  ,   egrep  ,  sed  &nb…

    Linux干货 2016-08-07
  • 将两个局域网用openvpn连接起来

    考虑到我们做集群的时候需要用到可能有20台机器,可能我的要求跟别人的不一样的,我需要做20台左右的集群,不仅仅是会,而且需要非常熟练的搭建,最后通过脚步一键自动化部署安装。 目前我有两台电脑,一台可以运行7台,另一台可以运行12台左右,刚好可以满足的我的要求,但是我两台电脑都是设置的nat模式的网络,为什么我非要配置nat模式呢,根据集群架构思想,为了保证架…

    Linux干货 2017-05-01
  • 虽千万人吾往矣

    哈佛有句名言 “当你觉得为时已晚的时候,恰恰是最早的时候”。这句话给了我虽千万人吾往矣的勇气。 之前那份工作懒散 安逸 。当我下定决心从那种环境中走出来的时候还是下了很大的决心。陌生的行业 陌生的环境 陌生的前途。我抱着对这份行业无限的憧憬来到了北京。   作为一个南方人的确有点不适合北方这黄沙漫漫的城市,刚来的一两天不停的打喷嚏,可能这就是北京欢…

    Linux干货 2018-03-26