文本三剑客grep爵士与手下的血泪奋战

文件查看命令： cat, tac,rev
cat [OPTION]… [FILE]…

-E: 显示行结束符$
-n: 对显示出的每一行进行编号
-A：显示所有控制符
-b：非空行编号
-s：压缩连续的空行成一行

文件查看

分页查看文件内容
more: 分页查看文件
more [OPTIONS…] FILE…
-d: 显示翻页及退出提示
less：一页一页地查看文件或STDIN输出
查看时有用的命令包括：
/文本搜索文本
n/N 跳到下一个 or 上一个匹配

less 命令是man命令使用的分页器

显示文本前或后行内容
head
head [OPTION]… [FILE]…

-c #: 指定获取前#字节
-n #: 指定获取前#行
-#：指定行数

tail
tail [OPTION]… [FILE]…

-c #: 指定获取后#字节
-n #: 指定获取后#行
-#：
-f: 跟踪显示文件新追加的内容,常用日志监控

在后台监控文件更新，使用命令：tail -0 file &
(&：是能让程序在后台运行的命令)

按列抽取文本cut和合并文件paste
cut [OPTION]… [FILE]…

-d DELIMITER: 指明分隔符，默认tab
-f FILEDS:
#: 第#个字段
#,#[,#]：离散的多个字段，例如1,3,6
#-#：连续的多个字段, 例如1-6
混合使用： 1-3,7
-c 按字符切割 –output-delimiter=STRING指定输出分隔符

cut和paste
显示文件或STDIN数据的指定列

cut -d: -f1 /etc/passwd
cat /etc/passwd | cut -d: -f7
cut -c2-5 /usr/share/dict/words

paste 合并两个文件同行号的列到一行
paste [OPTION]… [FILE]…
-d 分隔符:指定分隔符，默认用TAB
-s : 所有行合成一行显示
paste f1 f2
paste -s f1 f2

分析文本的工具

文本数据统计： wc
整理文本： sort
比较文件： diff和patch

收集文本统计数据wc

计数单词总数、行总数、字节总数和字符总数
可以对文件或STDIN中的数据运行

行数字数字符数

使用 -l 来只计数行数
使用 -w 来只计数单词总数
使用 -c 来只计数字节总数
使用 -m 来只计数字符总数

文本排序sort

把整理过的文本显示在STDOUT，不改变原始文件
$ sort [options] file(s)
常用选项

-r 执行反方向（由上至下）整理
-n 执行按数字大小整理
-f 选项忽略（ fold）字符串中的字符大小写
-u 选项（独特， unique）删除输出中的重复行
-t c 选项使用c做为字段界定符
-k X 选项按照使用c字符分隔的X列来整理能够使用多次

uniq

uniq命令：从输入中删除重复的前后相接的行
uniq [OPTION]… [FILE]…

-c: 显示每行重复出现的次数；
-d: 仅显示重复过的行；
-u: 仅显示不曾重复的行；

连续且完全相同方为重复
常和sort 命令一起配合使用：
sort userlist.txt | uniq -c

比较文件
比较两个文件之间的区别
$ diff foo.conf-broken foo.conf-works
5c5
< use_widgets = no
—
> use_widgets = yes
注明第5行有区别（改变）

复制对文件改变patch
diff 命令的输出被保存在一种叫做“补丁”的文件中
使用 -u 选项来输出“统一的（ unified）” diff格式文
件，最适用于补丁文件。
patch 命令复制在其它文件中进行的改变（要谨慎使用
！）
适用 -b 选项来自动备份改变了的文件
$ diff -u foo.conf-broken foo.conf-works > foo.patch
$ patch -b foo.conf-broken foo.patch

练习
1、找出ifconfig命令结果中本机的所有IPv4地址
2、查出分区空间使用率的最大百分比值
3、查出用户UID最大值的用户名、 UID及shell类型
4、查出/tmp的权限，以数字方式显示
5、统计当前连接本机的每个远程主机IP的连接数，并按从大
到小排序

Linux上文本处理三剑客
grep：文本过滤(模式： pattern)工具;
grep, egrep, fgrep（不支持正则表达式搜索）
sed： stream editor，文本编辑工具；
awk： Linux上的实现gawk，文本报告生成器；

grep
grep: Global search REgular expression and Print out
the line.
作用：文本搜索工具，根据用户指定的“模式”对目标文
本逐行进行匹配检查；打印匹配到的行；
模式：由正则表达式字符及文本字符所编写的过滤条件
grep [OPTIONS] PATTERN [FILE…]

grep命令选项