文本处理工具-习题

1 、找出ifconfig 命令结果中本机的所有IPv4地址

[root@centos7 ~]# ifconfig |head -2 |tail-1 |cut -dn -f2 |cut -d" " -f2

2 、查出分区空间使用率的最大百分比值

[root@centos7 ~]# df |cut -c44-46 |sort -n|tail -2 |head -1

3 、查出用户UID 最大值的用户名、UID 及shell 类型

[root@centos7 ~]# cat /etc/passwd |sort -t:-k 3 -n |tail -1 |cut -d: -f1,3,7

4 、查出/tmp 的权限,以数字方式显示

[root@centos7 ~]# stat /tmp |head -4 |tail-1 |cut -d/ -f1 |cut -d\( -f2

5 、统计当前连接本机的每个远程主机IP 的连接数,并按从大到小排序

# netstat -tn |cut -d: -f2|tr -s ' ' |cut -d" " -f2 |sort -n |uniq -c

 

1 、显示/proc/meminfo 文件中以大小s 开头的行;( 要求:使用两种方式)

[root@centos7 ~]# grep -e ^s -e ^S/proc/meminfo

[root@centos7 ~]# grep "^[sS]"/proc/meminfo

2 、显示/etc/passwd 文件中不以/bin/bash结尾的行

[root@centos7 ~]# grep -v"/bin/bash$" /etc/passwd

3 、显示用户rpc 默认的shell程序

[root@centos7 ~]# grep"^rpc\>" /etc/passwd |cut -d: -f7

4 、找出/etc/passwd 中的两位或三位数

[root@centos7 ~]# grep"\<[[:digit:]]\{2,3\}\>" /etc/passwd

5 、显示/etc/grub2.cfg 文件中,至少以一个空白字符开头的且后面跟非空白字符的行

[root@centos7 ~]# grep"^[[:space:]]\+[^[:space:]].*" /etc/grub2.cfg

6 、找出"netstat-tan" 命令的结果中以'LISTEN' 后跟多于0个空白字符结尾的行

[root@centos7 ~]# netstat -tan |grep "\<LISTEN[[:space:]]\+$"

7 、添加用户bash 、testbash 、basher 以及nologin( 其shell为 为/sbin/nologin), 而后找出/etc/passwd文件中用户名同shell名的行

[root@centos7 ~]# grep "^\(\<.*\>\).*\1$" /etc/passwd

[root@centos7 ~]# grep "^\([[:alnum:]]\{1,\}\):.*\1$" /etc/pa

[root@centos7 ~]# grep "^\(.*\):.*\1$" /etc/passwdsswd,必须把模式锚定称为单词

且后两者中的:本身就是一个:号字符,结合/etc/passwd中的:号界定了用户名

 

1 、显示当前系统root 、mage 或wang 用户的UID 和默shell

[root@centos7 ~]# egrep"^(root|mage|wang):" /etc/passwd |cut -d: -f1,3,7

[root@centos7 ~]# egrep"^(root|mage|wang)\>" /etc/passwd |cut -d: -f1,3,7

注意第一条命令中的:号的使用

2 、找出/etc/rc.d/init.d/functions文件中行首为某单词(包括下划线)后面跟一个小括号的行

[root@centos7 ~]# egrep "^[[:alpha:]_]+\(\).*"/etc/rc.d/init.d/functions是正确的

[root@centos7 ~]# grep "^[[:alpha:]_]\+[(][)].*"/etc/rc.d/init.d/functions,中括号也可满足

[root@centos7 ~]# grep "^[[:alpha:]_]\+\(\).*"/etc/rc.d/init.d/functions却是错误的,互为转义

3 、使用egrep 取出/etc/rc.d/init.d/functions中其基名

[root@centos7 ~]# echo "/etc/rc.d/init.d/functions" |egrep -o"[[:alnum:]]+$"

[root@centos7 ~]# echo "/etc/rc.d/init.d/functions" |egrep -o"[^/]+$"

先使用#echo “/etc/rc.d/init.d/functions”把路径转换为文本,然后再作进一步的处理

由于egrep=grep –E,所以grep的选项egrep同于实用

4 、使用egrep取出上面路径的目录名

[root@centos7 ~]# echo"/etc/rc.d/init.d/functions" |egrep -o "^/.*/"

[root@centos7 ~]# echo"/etc/rc.d/init.d/functions" |egrep -o "^.*/"

5 、统计以root 身份登录的每个远程主机IP地址的登录次数(用netstat –tn或者who来查看远程IP)

[root@centos7 ~]# who |egrep -o"\([[:digit:].]+\)" |tr -d '()'|sort -n | uniq -c

6 、利用扩展正则表达式分别表示0-9 、10-99 、100-199、200-249 、250-255

[0-9]、[1-9][0-9]、[1][0-9]{2}、[2][0-4][0-9]、[2][5][0-5]

7 、显示ifconfig 命令结果中所有IPv4 地址

[root@centos7 ~]# ifconfig| egrep  -o  "IP地址正则表达式"

8、用正则表达式表示IP地址(|是或者的意思)

IP地址的长度为32位,分为4段,每段8位,用十进制数字表示,每段数字范围为0~255,段与段之间用英文句点“.”隔开,例如:某台计算机IP地址为10.11.44.100;

分析IP地址的组成特点:250-255、200-249、0-199;
这三种情况可以分开考虑:
1. 250-255:特点:三位数,百位是2,十位是5,个位是0~5,用正则表达式可以写成:25[0-5]
2. 200-249:特点:三位数,百位是2,十位是0~4,个位是0~9,用正则表达式可以写成:2[0-4][0-9]
3. 0-199:这个可以继续分拆,这样写起来更加简单明晰
  3.1. 0-9:特点:一位数,个位是0~9,用正则表达式可以写成:[0-9]
  3.2. 10-99:特点:二位数,十位是1~9,个位是0~9,用正则表达式可以写成:[1-9][0-9]
  3.3.100-199:特点:三位数,百位是1,十位是0~9,个位是0~9,用正则表达式可以写成1[0-9]{2}

[0-9]|[1-9][0-9]|[1][0-9]{2}|[2][0-4][0-9]|[2][5][0-5]

“(([0-9]|[1-9][0-9]|[1][0-9]{2}|[2][0-4][0-9]|[2][5][0-5])\.){3}([0-9]|[1-9][0-9]|[1][0-9]{2}|[2][0-4][0-9]|[2][5][0-5])

其中.号进行了转义

9、用正则表达式表示手机号

“\<1(3|4|5|7|8)[0-9]{9}\>”

10、用正则表达式表示身份证号

“\<((1[1-5])|(2[1-3])|(3[1-7])|(4[1-6])|(5[0-4])|(6[1-5])|(71|81|82))([0-9]){4}(19|20)([0-9]){2}((0[1-9])|(1[0-2]))(0[1-9]|(1[0-9])|(2[0-9])|(3[0-1]))([0-9]){3}([0-9]|X)\>”

11、用正则表达式表示邮箱号

"\<([[:alnum:]]+(-|_)*[[:alnum:]]*)\>@([[:alnum:]]+\.)+[[:alnum:]]+"

 

1 、删除/etc/grub2.cfg文件中所有以空白开头的行行首的空白字符

[root@centos7 ~]# sed -n's/^[[:space:]]\+//p' /etc/grub2.cfg

2 、删除/testdir/fstab文件中所有以#开头,后面至少跟一个空白字符的行的行首的#和空白字符(sed命令的-n选项是不输出模式空间所有内容的自动打印,脚本命令p是仅打印模式空间中处理改动的内容,但是sed命令本身就默认输出模式空间所有内容的自动打印,所有-n选项和脚本命令的同时使用只会打印模式空间中处理改动的内容)

[root@centos7 testdir]# cat fstab | sed -r -n 's/^#[[:space:]]+//p'

3 、在/etc/fstab每一行行首增加#号

[root@centos7 ~]# sed -n 's/^/#&/p'/etc/fstab

4 、在/etc/fstab文件中不以#开头的行的行首增加#号

[root@centos7 ~]# sed -n 's/^[^#]/#&/p'/etc/fstab

5 、处理/etc/fstab路径, 使用sed命令取出其目录名和基名

取出目录名的两种方法:

[root@centos7 tmp]# echo"/etc/fst/sd/" | sed -r 's#[^/]+/?$##'

[root@centos7 tmp]# echo"/etc/rc.d/init.d/functions" | sed -r 's@^(.*/)([^/]+/?)$@\1@'

取出基名的两种方法:

[root@centos7 tmp]# echo"/etc/rc.d/init.d/functions" |sed -r 's@^(.*/)([^/]+/?)$@\2@'

[root@centos7 ~]# echo"/etc/fstab/" |sed 's/.*\<//'

6 、利用sed取出ifconfig命令中本机的IPv4地址

[root@centos7 ~]# ifconfig |sed -n '2p' |sed 's/^.*inet//'|sed 's/n.*//'

7 、统计centos安装光盘中Package 目录下的所有rpm文件的以.分隔倒数第二个字段的重复次数

# ls/run/media/root/CentOS\ 7\ x86_64/Packages/ |sed -r's@^(.*\.)(.*)\.rpm$@\2@'|sort|uniq –c

# ls/run/media/root/CentOS\ 7\ x86_64/Packages/ |rev|cut -d. -f2|rev|sort|uniq –c

其中第一种方法中.号要进行转义

 

 

 

原创文章,作者:18612763863,如若转载,请注明出处:http://www.178linux.com/31833

(0)
1861276386318612763863
上一篇 2016-08-15
下一篇 2016-08-15

相关推荐

  • Linux软件包管理

      在我们的运维工作,总是避免不了安装某些软件,或者编译安装某些软件,我们知道操作系统当中的程序都是有程序员通过开发工具开发的来,程序员直接编写的纯文本的文档我们称之为源代码,但我们的计算机只能识别二进制程序,那么必须要将源代码变成计算机能识别的二进制程序,这里需要通过编译器来进行编译,将源码转换成二进制程序,再通过安装即可。 还有一类程序就是二进…

    Linux干货 2016-08-24
  • CentOS7中nmcli网络管理及使用详解

    一、网络接口配置工具    在CentOS7系统中,强烈推荐使用nmcli管理网卡。下面记录的是nmcli的使用详解。    网络接口配置工具NetworkManager(简称为nmcli),该命令的作用是:可以查询网络连接的状态,也可以用来管理网络(设置系统每个网卡的特性)。该命令如何使用呢,其实可以用"n…

    Linux干货 2016-09-11
  • 第五周

      第五周 1 显示/boot/grub/grub.conf中以至少一个空白字符开头的行;      grep "^[[:space:]]\+" /boot/grub/grub.conf 2 显示/etc/rc.d/rc.sysinit文件中以#开头,后面跟至…

    Linux干货 2017-01-02
  • find总结及练习

    文件查找: 在文件系统上查找符合条件的文件; 文件查找:locate, find非实时查找(数据库查找):locate 实时查找:find locate: 依赖于事先构建的索引;索引的构建是在系统较为空闲时自动进行(周期性任务);手动更新数据库(updatedb); 索引构建过程需要遍历整个根文件系统,极消耗资源; 工作特点: 查找速度快; 模糊查…

    Linux干货 2016-07-22
  • Linux基础之软件包管理

    一.概述 在redhat系列的发行版中,采用rpm软件包管理器,rpm原名是Red Hat Package Manager,后来当其他发行版也采用这种软件包管理机制以后,重新命名,改为RPM Package Manager,它所能提供的功能是将编译好的应用程序文件打包成一个或几个程序文件,从而使得用户能够方便的安装,升级,卸载软件,而yum则是rpm包管理器…

    Linux干货 2016-11-16
  • Sed简介

    Sed简介    一、简介   sed全称是:Stream EDitor。sed命令的功能同awk类似,差别在于,sed简单,对列处理的功能要差一些,awk的功能复杂,对列处理的功能比较强大。  sed 是一种在线编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern s…

    Linux干货 2015-05-11