一、
抽取文本的命令
1、cat
cat [option]… [file]…
常用选项:
-E 显示行尾结束符$
-n –number,对显示的每一行进行编号
-A 显示所有控制符
-b –number-blank,对空白行不编号,只对非空白行编号
-s –squeeze-blank,压缩连续的空行成一行
2、more分页查看文件
more [option]… file…
-d 显示翻页及退出提示
3、less,与more类似,一页一页的查看本地文件或STDIN输出
可以用/和?进行搜索
n/N 可以配合搜索使用
4、head
head [option]… [file]…
常用选项:
-c# 指定获取前#字节
-n# 指定获取前#行
-# 指定行数
5、tail 与head的选取顺序相反
tail [option]… [file]…
常用选项:
-c# 指定获取后#字节
-n# 指定获取后#行
-# 指定行数
-f 跟踪显示文件新追加的内容,常用作日志监控,tail -f -0 [file] & 后台应用刷新显示
6、cut 对行进行分隔,然后切割对应的整列
cut [option]… [file]…
-d[分隔符] 指明分隔符,默认tab
-f[Fields]:
# 获取第#个字段
#,# 离散的多个字段,例如1,3,5,6
#-# 连续的多个字段 例如1-6
#,#-# 混合使用 例如 1,3,5-7
-c 按字符切割
–output-delimiter=STRING 指定输出分隔符
7、paste 合并两个文件同行号的列到一行
paste [option]… [file]…
常用选项
-d[分隔符] 指定分隔符,默认用tab
-s 所有行合成一行显示
8、wc 计算单词总数、行总数、字节总数和字符总数
可以对文件和STDIN中的数据运行
wc [option]… [file]…
常用选项
-l 计算行数
-w 计算单词总数
-c 计算字节总数
-m 计算字符总数
9、文本排序sort 把整理过的文本显示在STDOUT上,不改变原始文件
sort [option] file
常用选项
-r 执行反方向整理
-n 按数字大小进行整理
-f 忽略字符串中的字符大小写
-u 删除输出中的重复行
-t c 使用c作为字段定界符
-k X 按照使用c字符分隔的X列来整理能够使用多次
10、uniq 从输入中删除重复的前后相接的行
uniq [option]… [file]…
-c count显示每行重复出现的次数
-d 仅显示重复过的行
-u 仅显示不曾重复的行,连续且完全相同方为重复
常配合sort命令一起使用 sort file | uniq -c
11、diff 比较两个文件之间的区别
diff命令的输出被保存在一种叫做“补丁”的文件中
使用 -u 选项来输出“统一的”diff格式文件,最适用于补丁文件
配合 patch 命令可以复制在其他文件中进行的改变,但是会覆盖原文件;配合 -b 选项使用,自动备份改变了的文件
原创文章,作者:black_fish,如若转载,请注明出处:http://www.178linux.com/29424