文本处理工具

文本处理工具
1、查看文件内容
cat -v 显示非打印字符
      -E 显示$
     -T 显示TAB
     -n 显示行号
     -s 将连续的重复空行变成一行
     -A = -vET
less
2、文件截取
head -n 行号 显示前n行
          -行号 显示前n行
          -c 字节数 显示前n个字节
tail -n 行号 显示后n行
       -行号 显示后n行
       -c 字节数 显示后n个字节
       -f 动态显示
3、按列抽取
cut -d 指定分隔符
       -f 选取第几列

截取列,并指定分隔符

clipboard

文本处理工具
paste paste f1 f2 [f3]
paste -s f1 将文件内容变成一行显示 也可以用 tr ‘\n’ ‘\t’ 实现
paste -d “” f1 f2 [f3] 合并后的分隔符,默认TAB
4、按关键字抽取行
grep –color=auto 将匹配的结果着色显示
         -v 反向匹配
         -i 忽略大小写
         -n 显示的结果前增加行号
         -c 仅显示匹配到结果的行数
         -o 仅显示匹配到的字符串
         -q 静默模式,不输出任何信息
             或者 &> /dev/null
         -A# 显示关键字行及向后#行
         -B# 显示关键字行及向前#行
           nmap -v -sP 172.17.252.0/24 |grep -B1 “Host is up”|grep for |cut -d” ” -f5 |wc -l
         -C# 显示关键字向前#行,当前行,及向后#行
         -e 关键字1 -e 关键字2 实现多个选项间的逻辑or关系
         -w 匹配整个单词
         -E 使用扩展正则表达式 或egrep
         -F 不使用正则表达式 或 fgrep
5、收集文本统计数据
wc -m 字符数
      -c 字节 一个汉字3字节,一个单词一字节
      -l 行数
    -w 单词数
6、文本排序
sort -r 执行反方向(由上至下)整理
       -n 执行按数字大小整理
       -f 选项忽略(fold)字符串中的字符大小写
       -u 选项(独特,unique)删除输出中的重复行
       -t c 选项使用c做为字段界定符
       -k X 选项按照使用c字符分隔的X列来整理能够使用多次
uniq 去除连续的重复行要想去除非连续的行,先用sort排序
         -c 显示连续重复的次数
         -d 仅显示重复的次数
         -u 仅显示不曾重复的行
         sort userlist.txt | uniq -c 常配合使用用来统计重复次数排序
7、比较文件
diff -u f1 f2 > diff.log 生成补丁
patch -b f1 diff.log 通过补丁还原文件
正则表达式课后题
留给后人的一笔财富
1、显示/proc/meminfo文件中以大小s开头的行(要求:使用两种方法)
cat /proc/meminfo|grep “^[Ss]”
cat /proc/meminfo|grep -i “^s”
cat /proc/meminfo|grep -e ^s -e ^S
cat /proc/meminfo|grep “^s\|^S”
cat /proc/meminfo|grep “^[s\|S]”
2、显示/etc/passwd文件中不以/bin/bash结尾的行

 grep -v “/bin/bash$” /etc/passwd

clipboard

3、显示用户rpc默认的shell程序
grep “^rpc\>” /etc/passwd | cut -d : -f7
grep -w “^rpc” /etc/passwd | cut -d : -f7

clipboard

4、找出/etc/passwd中的两位或三位数
cat /etc/passwd |grep -o “\<[0-9]\{2,3\}\>”

clipboard

5、显示CentOS7的/etc/grub2.cfg文件中,至少以一个空白
字符开头的且后面存非空白字符的行
cat /etc/grub2.cfg |grep “^[[:space:]]\+[^[:space:]]”

clipboard

6、找出“netstat -tan”命令的结果中以‘LISTEN’后跟任意多
个空白字符结尾的行
netstat -tan|grep “\<LISTEN\>[[:space:]]*$”

clipboard

7、显示CentOS7上所有系统用户的用户名和UID
cat /etc/passwd |cut -d: -f1,3 |grep “\<[[:digit:]]\{1,3\}\>”$

clipboard

注:centos7 系统用户UID<1000
8、添加用户bash、testbash、basher、sh、nologin(其shell
为/sbin/nologin),找出/etc/passwd用户名同shell名的行
cat /etc/passwd | grep “\(^.*\)\>.*\/\1$”

clipboard

9、仅利用df和grep和sort,取出磁盘各分区利用率,并从大到小排序
df |grep ^/dev/sd |grep -o “\b[[:digit:]]\{1,3\}\b%”|sort -rn

clipboard

注:取出磁盘分区dev/sd
!!!以下自己做的不确定对错
1、显示三个用户root、mage、wang、的UID和默认shell
[root@localhost ~]# cat /etc/passwd |grep -E “^(root|mage|wang)” |cut -d: -f3,7

clipboard

2、找出/etc/rc.d/init.d/functions文件行首为某单词(包括下划线)后面跟一个小括号的行
[root@localhost ~]# cat /etc/rc.d/init.d/functions |grep “.*()”

clipboard

3使用egrep取出/etc/rc.d/init.d/functions中其基名

clipboard

4、使用egrep取出上面路径的目录名
[root@localhost ~]# echo /etc/rc.d/init.d/functions |egrep -o “^(/).*\1”

clipboard

5、统计last命令中以root登录的每个主机IP地址登录次数

clipboard

6、利用扩展正则表达式分别表示0-9、10-99、100-199、200-249、250-255

clipboard

7、显示ifconfig命令结果中所有IPv4地址
[root@centos6 ~]# ifconfig |grep -w “inet addr” |tr -s ” ” “:” |cut -d: -f4

clipboard

[root@centos6 ~]# ifconfig |egrep -o “([0-9]{3}(\.[0-9]{1,3}){3})”

clipboard

8、将此字符串:welcome to magedu linux 中的每个字符去重并排序,重复次数多的排到前面

clipboard

原创文章,作者:jieran,如若转载,请注明出处:http://www.178linux.com/83389

(0)
jieranjieran
上一篇 2017-07-30
下一篇 2017-07-30

相关推荐

  • Linux三剑客之grep使用入门指南

    Linux的grep是一个具有强大功能的文本搜索工具,正确的学习和使用,能很大程度上提高工作效率,减轻运维工作所面临的压力。

    2017-09-09
  • N26-第八周

    1、请描述网桥、集线器、二层交换机、三层交换机、路由器的功能、使用场景与区别。     网桥(birdge):工作于OSI模型中的数据链路层,是连接两个局域网的一种存储/转发设备,能将一个大的LAN分割为多个网段,或将两个以上的LAN互联为一个逻辑LAN,使LAN上的所有用户都可访问服务器,可以分割冲突域。   &nb…

    2017-03-08
  • 命令find应用

    作业:  查找/var目录下属主为root,且属组为mail的所有文件 [root@localhost bin]# find /var/ -user root -group mail     2. 查找/var目录下不属于root、lp、gdm的所有文件    [root@localhost bin…

    Linux干货 2016-08-22
  • rsyslog将日志记录于MySQL中

    数据库服务器:CentOS7 192.168.119.159   日志:CentOS6 192.168.119.129     准备mysql数据库 和 用户账户 [root@localhost ~]# yum install mariadb-server   [root@localhost ~]# systemctl…

    2018-02-05
  • 第十周-Centos启动流程及Shell脚本编程

    一、CentOS启动流程 POST –> Boot Sequence(BIOS) –> Boot Loader (MBR) –> Kernel(ramdisk) –> rootfs –> switchroot –> /sbin/init –…

    2017-10-14
  • ansible原理及简单应用

    一、基础介绍 1、简介 ansible是新出现的自动化运维工具,基于python开发,集合了众多运维工具(puppet、cfengine、chef、func、fabric)的优点,实现了批量系统配置、批量程序部署、批量运行命令等功能。ansible是基于模块工作的,本身没有批量部署的能力。真正具有批量部署的是ansible所运行的模块,ansible只是提供…

    Linux干货 2016-01-13