awk的基本原理

awk的工作原理
 
一次读取一行文本,按输入分隔符进行切片,切成多个组成部分,将每片直接保存在内建的变量中,$1,$2,$3….,引用指定的变量,可以显示指定断,或者多个断。如果需要显示全部的,需要使用$0来引用。可以对单个片断进行判断,也可以对所有断进行循环判断。其默认分隔符为空格
 
awk的基本用法格式
awk [options] ‘program’ FILE……
 ◦语句之间用分号分隔
[options]
 ◦ -F : 指明输入时用到的字段分隔符
 ◦ -v var=VALUE : 自定义变量 
 在awk中变量的引用不需要加$,而是直接引用
awk用法的简要介绍
第一种模式
awk [options] ‘scripts’ file1,file2…..
 
在这种模式中,scripts主要是命令的堆砌,对输入的文本行进行处理,通过命令print,printf或是输出重定向的方式显示出来,这里经常用到的知识点是:awk的内置变量,以及命令print和printf的使用

第二种模式
awk [options] ‘PATTERN{action}’ file,file2…..
 
在这种模式中,最重要的是5种模式和5种action的使用,以及awk的数组的使用和内置函数
 

第一种模式
1、print
 1、各项目之间使用逗号隔开,而输出时则以空白字符分隔
 2、输出的Item可以为字符串或数值,当前记录的字段(如$1)、变量或awk的表达式,数值会先转换为字符串,而后再输出
 3、print命令后面的Item可以省略,此时其功能相当于print $0,因此,如果想输出空白行,则需要使用print””
 4、如果引用变量$1或其他的,是不能使用引号引起来
 
2、内置变量
  FS : input field seperator,输入的分隔符,默认为空白字符
  OFS: output field seperator,输出的分隔符,默认为空白字符
  RS : input record seperator,输入的换行符
  ORS: output record seperator,输出时的换行符
  NF : number of field ,字段个数 awk ‘{print NF}’ /etc/fstab :打印每行的最后一个字段为第几个字段,这里是数量引用,不是对应的值引用 
awk ‘{print $NF}’ /etc/fstab : 打印每行中的最后一个字段
 

NR : number of record,文件中的行数
 awk ‘{print NR}’ /etc/fstab: 打印行号,其会个行号都显示
 awk ‘END{print NR}’ /etc/fstab: 显示文本的总行数,其只是在文本处理完成后,只显示一次行号
 awk ‘{print NR}’ file1 file2 : 会每把所有文档进行总的编号,而不是单独对文件进行编号 

 FNR : 对每个文件进行行数单独编号
 awk ‘{print FNR}’ file1 file2 : 会对每个文件的行数进行单独的编号显示
 
 FILENAME : awk命令所处理的文件的名称 ◦awk ‘{print FILENAME}’ file1 : 显示当前文件名,但会每行显示一次
 awk ‘END{print FILENAME}’ file1 : 显示当前文件名,但只会显示一次
 
 ARGC : 命令行中参数的个数,其awk命令也算一个参数 ◦awk ‘END{print ARGC}’ /etc/fstab : 显示共有几个参数
 
 ARGV : 其是一个数组,保存的是命令行所给定的各参数
  awk ‘END{print ARGV[0]}’ /etc/fstab : 显示第一个参数,默认第一个参数个awk命令本身
 
算术操作符
  -x : 负值
  +x : 转换为数值
  x^y : 
 x**y : 次方
  x*y : 乘法
  x/y : 除法

格式符
  %c: 显示字符的ASCII码
  %d,%i : 显示十进制整数
  %e,%E: 科学计数法数值显示
  %f : 显示为浮点数
  %g,%G: 以科学数法或浮点形式显示数值
  %s: 显示字符串
  %u: 无符号整数
  %%: 显示%号自身,相当于转义

原创文章,作者:sunhao,如若转载,请注明出处:http://www.178linux.com/80026

(2)
sunhaosunhao
上一篇 2017-07-11
下一篇 2017-07-11

相关推荐

  • N28-第四周

    1、复制/etc/skel目录为/home/tuser1,要求/home/tuser1及其内部文件的属组和其它用户均没有任何访问权限。
    2、编辑/etc/group文件,添加组hadoop。
    3、手动编辑/etc/passwd文件新增一行,添加用户hadoop,其基本组ID为hadoop组的id号;其家目录为/home/hadoop。
    4、复制/etc/skel目录为/home/hadoop,要求修改hadoop目录的属组和其它用户没有任何访问权限。
    5、修改/home/hadoop目录及其内部所有文件的属主为hadoop,属组为hadoop。
    6、显示/proc/meminfo文件中以大写或小写S开头的行;用两种方式;
    7、显示/etc/passwd文件中其默认shell为非/sbin/nologin的用户;
    8、显示/etc/passwd文件中其默认shell为/bin/bash的用户;
    9、找出/etc/passwd文件中的一位数或两位数;
    10、显示/boot/grub/grub.conf中以至少一个空白字符开头的行;
    11、显示/etc/rc.d/rc.sysinit文件中以#开头,后面跟至少一个空白字符,而后又有至少一个非空白字符的行;
    12、打出netstat -tan命令执行结果中以‘LISTEN’,后或跟空白字符结尾的行;
    13、添加用户bash, testbash, basher, nologin (此一个用户的shell为/sbin/nologin),而后找出当前系统上其用户名和默认shell相同的用户的信息;

    2017-12-30
  • Linux实验-搭建路由环境

    Linux实验-搭建路由环境 背景: 在学习网络基础过程中,为了加强理解路由功能,准备用Linux模拟一个路由环境。同时也试试Linux的路由转发功能。 实验简介: 准备5个虚拟机,其中三个做路由,两个做客户机,相连的设备之间在同一个网段,三个路由设备在中间,两个客户机在两侧,最后实现两个虚拟机能相互通信。 实验规划: 这里配的IP都是随意配的,保证相连设备…

    2017-08-19
  • python Django分页

    自定义html_helper.py  —>  Page_helper类 #coding:utf-8 from django.utils.safestring import mark_safe class Page_Helper(object):    …

    Linux干货 2016-08-22
  • bash通配符和正则表达式元字符部分归纳

    Linux中有各种各样的字符,而且在不同环境和不同命令之下含义也不同 作为新手,决定先归纳学到的符号,方便后面学习厘清它们之间的关系。 glob 简化了的正则表达式 bash默认通配符: ? :只匹配一个任意字符; * :匹配零个或多个任意字符;   [^] :方括号及其中^中的取反 [abc]:匹配任何一个列在方括号中的字符(这个例子要么匹配一个…

    Linux干货 2016-04-11
  • 详解Linux下用户和组的配置文件

    本文将介绍Linux下用户和组的概念及相关配置文件,通过本文,能更好的认识/etc/pssswd ,/etc/group,以及UID、GID的概念,最后将通过修改用户配置文件来实现用户和组的管理工作,对Linux的多任务、多用户有一个更清楚的认识。 一、用户(USER) 在LInux上用户的管理工作是通过修改相关的配置文件来实现的,在日常的工作中主要包含对用…

    Linux干货 2016-10-23
  • N22+北京zhangzhangzhang+第四周作业

    1、复制/etc/skel目录为/home/tuser1,要求/home/tuser1及其内部文件的属组和其它用户均没有任何访问权限。 cp -r /etc/skel /home/tuser1    ls -ld /home/tuser1   &nb…

    Linux干货 2016-09-05