部分基本的文本处理工具

一、

  抽取文本的命令

    1、cat

    cat [option]… [file]…

    常用选项:

        -E  显示行尾结束符$

        -n  –number,对显示的每一行进行编号

        -A  显示所有控制符

         -b  –number-blank,对空白行不编号,只对非空白行编号

        -s  –squeeze-blank,压缩连续的空行成一行

   2、more分页查看文件

    more [option]… file…

        -d  显示翻页及退出提示

   3、less,与more类似,一页一页的查看本地文件或STDIN输出

        可以用/和?进行搜索

        n/N 可以配合搜索使用

   4、head

    head [option]… [file]…

  常用选项:

    -c#  指定获取前#字节

    -n#  指定获取前#行

    -#   指定行数

   5、tail 与head的选取顺序相反

    tail [option]… [file]…

  常用选项:

    -c#  指定获取后#字节

    -n#  指定获取后#行

    -#   指定行数

    -f   跟踪显示文件新追加的内容,常用作日志监控,tail -f -0 [file] &  后台应用刷新显示

    6、cut    对行进行分隔,然后切割对应的整列

    cut [option]… [file]…

    -d[分隔符]  指明分隔符,默认tab

    -f[Fields]:

        #  获取第#个字段

        #,#   离散的多个字段,例如1,3,5,6

        #-#   连续的多个字段  例如1-6

        #,#-#  混合使用  例如 1,3,5-7

    -c  按字符切割

    –output-delimiter=STRING 指定输出分隔符

    7、paste    合并两个文件同行号的列到一行

    paste [option]… [file]…

   常用选项

    -d[分隔符]   指定分隔符,默认用tab

    -s      所有行合成一行显示

   8、wc   计算单词总数、行总数、字节总数和字符总数

        可以对文件和STDIN中的数据运行

    wc [option]… [file]…

  常用选项

    -l  计算行数

    -w  计算单词总数

    -c  计算字节总数

    -m  计算字符总数

   9、文本排序sort   把整理过的文本显示在STDOUT上,不改变原始文件

    sort [option] file

  常用选项

    -r   执行反方向整理

    -n   按数字大小进行整理

    -f   忽略字符串中的字符大小写

    -u   删除输出中的重复行

    -t c  使用c作为字段定界符

    -k X  按照使用c字符分隔的X列来整理能够使用多次

   10、uniq   从输入中删除重复的前后相接的行

    uniq [option]… [file]…

    -c   count显示每行重复出现的次数

    -d   仅显示重复过的行

    -u   仅显示不曾重复的行,连续且完全相同方为重复

  常配合sort命令一起使用  sort file | uniq -c

   11、diff  比较两个文件之间的区别 

    diff命令的输出被保存在一种叫做“补丁”的文件中

    使用 -u 选项来输出“统一的”diff格式文件,最适用于补丁文件

    配合 patch 命令可以复制在其他文件中进行的改变,但是会覆盖原文件;配合 -b 选项使用,自动备份改变了的文件 

 

        

        

原创文章,作者:black_fish,如若转载,请注明出处:http://www.178linux.com/29424

(0)
black_fishblack_fish
上一篇 2016-08-05
下一篇 2016-08-05

相关推荐

  • 文件的权限详解(一)

    文件的权限 修改文件的属主和属组 chown 功能:更改属主命令,同时也能更改属组用法:   chown  选项  [属主名][:属组名]  文件名  (分隔符改成.也行) chown  选项   参考的文件=要更改的文件 chown [OPTION]… –reference=R…

    Linux干货 2016-08-04
  • 三次握手和四次挥手

    今天来聊一下事实标准协议TCP/IP中传输层里TCP协议中,主机与服务器建立连接时的三次握手,和断开连接时的四次挥手。 本博文分两部分介绍,    一:状态详解    二:三次握手和四次挥手状态介绍 这里总共涉及到十种状态,其实总共有十一种状态,接下来分别介绍一下它们; 一:状态详解 CLOSED:关闭—&…

    2017-09-01
  • bash脚本编程之流程控制if、for、while、until简介

    概述     之前介绍了一些bash脚本编程的变量、运算、条件测试的一些基础内容,了解了脚本实际上就是一些语句加上一些流程控制组合起来,实现某种功能的可执行文件。我们知道,条件测试的目的,实际就是为了实现一种流程的控制,那么本篇就简单介绍一下bash里面常见的流程控制语句,包括选择、循环等内容,具体包括以下几个部分: …

    Linux干货 2016-08-18
  • linux学习第二天知识点-linux入门及使用帮助

    一 基础命令 1. #ifconfig     显示或配置网卡的命令,英文全称是network interfaces configuring。     配置网卡的IP地址语法例:ifconfig eth0 192.168.0.1 netmask 255.255.255.0 2.&…

    Linux干货 2016-07-26
  • linux软件包管理

    linux软件包管理 简介     在Linux系统中,软件包的安装和管理是很重要的知识,而linux/unix一个麻烦的地方就是软件安装程序比较麻烦和复杂,尤其是当所安装的软件包要处理较多的包依赖关系,这就更让人头疼了,最常见linux软件安装方式有三种:     本文主要介绍Linux中RedHat或CentOS发…

    系统运维 2016-05-05
  • linux基础之lvm操作流程

    linux基础之lvm基本操作流程    LVM是 Logical Volume Manager(逻辑卷管理)的简写,它是Linux环境下对磁盘分区进行管理的一种机制,它由Heinz Mauelshagen在Linux 2.4内核上实现,目前最新版本为:稳定版1.0.5,开发版 1.1.0-rc2,以及LVM2开发版。Linux用户安装L…

    2017-03-19