文本处理工具
1、查看文件内容
cat -v 显示非打印字符
-E 显示$
-T 显示TAB
-n 显示行号
-s 将连续的重复空行变成一行
-A = -vET
less
2、文件截取
head -n 行号 显示前n行
-行号 显示前n行
-c 字节数 显示前n个字节
tail -n 行号 显示后n行
-行号 显示后n行
-c 字节数 显示后n个字节
-f 动态显示
3、按列抽取
cut -d 指定分隔符
-f 选取第几列
截取列,并指定分隔符
paste paste f1 f2 [f3]
paste -s f1 将文件内容变成一行显示 也可以用 tr ‘\n’ ‘\t’ 实现
paste -d “” f1 f2 [f3] 合并后的分隔符,默认TAB
4、按关键字抽取行
grep –color=auto 将匹配的结果着色显示
-v 反向匹配
-i 忽略大小写
-n 显示的结果前增加行号
-c 仅显示匹配到结果的行数
-o 仅显示匹配到的字符串
-q 静默模式,不输出任何信息
或者 &> /dev/null
-A# 显示关键字行及向后#行
-B# 显示关键字行及向前#行
nmap -v -sP 172.17.252.0/24 |grep -B1 “Host is up”|grep for |cut -d” ” -f5 |wc -l
-C# 显示关键字向前#行,当前行,及向后#行
-e 关键字1 -e 关键字2 实现多个选项间的逻辑or关系
-w 匹配整个单词
-E 使用扩展正则表达式 或egrep
-F 不使用正则表达式 或 fgrep
5、收集文本统计数据
wc -m 字符数
-c 字节 一个汉字3字节,一个单词一字节
-l 行数
-w 单词数
6、文本排序
sort -r 执行反方向(由上至下)整理
-n 执行按数字大小整理
-f 选项忽略(fold)字符串中的字符大小写
-u 选项(独特,unique)删除输出中的重复行
-t c 选项使用c做为字段界定符
-k X 选项按照使用c字符分隔的X列来整理能够使用多次
uniq 去除连续的重复行要想去除非连续的行,先用sort排序
-c 显示连续重复的次数
-d 仅显示重复的次数
-u 仅显示不曾重复的行
sort userlist.txt | uniq -c 常配合使用用来统计重复次数排序
7、比较文件
diff -u f1 f2 > diff.log 生成补丁
patch -b f1 diff.log 通过补丁还原文件
正则表达式课后题
留给后人的一笔财富
1、显示/proc/meminfo文件中以大小s开头的行(要求:使用两种方法)
cat /proc/meminfo|grep “^[Ss]”
cat /proc/meminfo|grep -i “^s”
cat /proc/meminfo|grep -e ^s -e ^S
cat /proc/meminfo|grep “^s\|^S”
cat /proc/meminfo|grep “^[s\|S]”
2、显示/etc/passwd文件中不以/bin/bash结尾的行
grep -v “/bin/bash$” /etc/passwd
3、显示用户rpc默认的shell程序
grep “^rpc\>” /etc/passwd | cut -d : -f7
grep -w “^rpc” /etc/passwd | cut -d : -f7
4、找出/etc/passwd中的两位或三位数
cat /etc/passwd |grep -o “\<[0-9]\{2,3\}\>”
5、显示CentOS7的/etc/grub2.cfg文件中,至少以一个空白
字符开头的且后面存非空白字符的行
cat /etc/grub2.cfg |grep “^[[:space:]]\+[^[:space:]]”
6、找出“netstat -tan”命令的结果中以‘LISTEN’后跟任意多
个空白字符结尾的行
netstat -tan|grep “\<LISTEN\>[[:space:]]*$”
7、显示CentOS7上所有系统用户 的用户名和UID
cat /etc/passwd |cut -d: -f1,3 |grep “\<[[:digit:]]\{1,3\}\>”$
注:centos7 系统用户UID<1000
8、添加用户bash、testbash、basher、sh、nologin(其shell
为/sbin/nologin),找出/etc/passwd用户名同shell名的行
cat /etc/passwd | grep “\(^.*\)\>.*\/\1$”
9、仅利用df和grep和sort,取出磁盘各分区利用率,并从大到小排序
df |grep ^/dev/sd |grep -o “\b[[:digit:]]\{1,3\}\b%”|sort -rn
注:取出磁盘分区dev/sd
!!!以下自己做的不确定对错
1、显示三个用户root、mage、wang、的UID和默认shell
[root@localhost ~]# cat /etc/passwd |grep -E “^(root|mage|wang)” |cut -d: -f3,7
2、找出/etc/rc.d/init.d/functions文件行首为某单词(包括下划线)后面跟一个小括号的行
[root@localhost ~]# cat /etc/rc.d/init.d/functions |grep “.*()”
3使用egrep取出/etc/rc.d/init.d/functions中其基名
4、使用egrep取出上面路径的目录名
[root@localhost ~]# echo /etc/rc.d/init.d/functions |egrep -o “^(/).*\1”
5、统计last命令中以root登录的每个主机IP地址登录次数
6、利用扩展正则表达式分别表示0-9、10-99、100-199、200-249、250-255
7、显示ifconfig命令结果中所有IPv4地址
[root@centos6 ~]# ifconfig |grep -w “inet addr” |tr -s ” ” “:” |cut -d: -f4
[root@centos6 ~]# ifconfig |egrep -o “([0-9]{3}(\.[0-9]{1,3}){3})”
8、将此字符串:welcome to magedu linux 中的每个字符去重并排序,重复次数多的排到前面
原创文章,作者:jieran,如若转载,请注明出处:http://www.178linux.com/83389