第八周笔记

awk 文本三剑客之一，文本处理工具

awk分为Gawk Pawk Dawk Centos用的是Gawk
模式扫描处理的语言
/user/bin/awk awk的路径

awk的使用语法
awk [选项] `program` var=value file…..(变量赋值)
awk [options] ‘program’ var=value file…
awk [options] -f programfile var=value file… -f 调用语言文件
awk [options] ‘BEGIN{ action;… } pattern{ action;… } END{ action;… }’ file …
awk 程序通常由：BEGIN语句块、能够使用模式匹配的通用语句块、END语句块，共3部
分组成
program通常是被单引号或双引号中

选项：
-F 指明输入时用到的字段分隔符
-v var=value: 自定义变量

行：记录record 定义分隔符一个分隔符算一行（分隔符自定义默认是空格）
列：字段或者域field 或者属性分割符之前的任意分开的算一个字段

基本格式：awk [options] ‘program’ file…
program:pattern{action statements;..}
pattern和action：
• pattern部分决定动作语句何时触发及触发事件
BEGIN,END
• action statements对数据进行处理，放在{}内指明
print, printf（打印里面的内容）
分割符、域和记录
• awk执行时，由分隔符分隔的字段（域）标记$1,$2..$n称为域标识。$0为所有域，
注意：和shell中变量$符含义不同
• 文件的每一行称为记录
• 省略action，则默认执行 print $0 的操作

awk的工作原理
第一步：执行BEGIN{action;… }语句块中的语句 BEGIN经常用于处理表头（开始）
 第二步：从文件或标准输入(stdin)读取一行，然后执行pattern{ action;… }语句块，它
逐行扫描文件，从第一行到最后一行重复这个过程，直到文件全部被读取完毕。
 第三步：当读至输入流末尾时，执行END{action;…}语句块 end做汇总用
 BEGIN语句块在awk开始从输入流中读取行之前被执行，这是一个可选的语句块，比如
变量初始化、打印输出表格的表头等语句通常可以写在BEGIN语句块中
 END语句块在awk从输入流中读取完所有的行之后即被执行，比如打印所有行的分析
结果这类信息汇总都是在END语句块中完成，它也是一个可选语句块
 pattern语句块中的通用命令是最重要的部分，也是可选的。如果没有提供pattern语句
块，则默认执行{ print } ，即打印每一个读取到的行，awk读取的每一行都会执行该语句块

print格式： print item1, item2, …
 要点：
(1) 逗号分隔符
(2) 输出的各item可以字符串，也可以是数值；当前记录的字段、变量或awk的表达式
(3) 如省略item，相当于print $0
示例：
awk ‘{print “hello,awk”}’

awk –F: ‘{print}’ /etc/passwd
awk –F: ‘{print “wang”}’ /etc/passwd
awk –F: ‘{print $1}’ /etc/passwd
awk –F: ‘{print $0}’ /etc/passwd
awk –F: ‘{print $1”\t”$3}’ /etc/passwd （\t）tab键用换行符作为分割符
tail –3 /etc/fstab |awk ‘{print $2,$4}’ 倒数三行的$2$4字段

本文来自投稿，不代表Linux运维部落立场，如若转载，请注明出处：http://www.178linux.com/99003

第八周笔记

相关推荐

解决man命令输出到文档打开乱码问题

N31-7

sudo相关配置详解及aide高级入侵检测环境

N31期-第二周作业

Linux用户与组管理

Linux 的哲学思想

分享到: