awk概述
 使用语法
 常用命令选项
 相关输出命令
 print item1,item2,…
printf FORMAT,item1,item2,….
相关格式符
 相关修饰符
 相关内建变量
 相关内置函数
 相关操作符
 相关模式
 相关控制语句及示例
 if(condition) statements
if(condition){statements} else {statements}
while (condition){statements}
for(expr1;expr2;expr3){statements}
相关扩展针对与使用awk统计网站访问相关
 统计访问频次最高的5个ip
统计恶意ip
找出访问最多的文件(下载类网站常用,这里以.exe扩展名举例)
统计该网站的流量,统计结果以“G“”显示
 查看日志中出现100次以上的IP
查看某一IP在网站内都访问了哪些资源

awk概述

awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。awk的处理文本和数据的方式是这样的，它逐行扫描文件，从第一行到最后一行，寻找匹配的特定模式的行，并在这些行上进行你想要的操作。如果没有指定处理动作，则把匹配的行显示到标准输出(屏幕)，如果没有指定模式，则所有被操作所指定的行都被处理。awk分别代表其作者姓氏的第一个字母。因为它的作者是三个人，分别是Alfred Aho、Brian Kernighan、Peter Weinberger。gawk是awk的GNU版本，它提供了Bell实验室和GNU的一些扩展。下面介绍的awk是以GUN的gawk为例的，在linux系统中已把awk链接到gawk，所以下面全部以awk进行介绍。

使用语法

awk [ -F Ere ] [ -v Assignment ] … { -f ProgramFile | 'Program' } [ [ File … | Assignment … ] ] …

常用命令选项

-F fs or --field-separator fs
指定输入文件折分隔符，fs是一个字符串或者是一个正则表达式，如-F:。
-v var=value or --asign var=value
赋值一个用户定义变量。
-f scripfile or --file scriptfile
从脚本文件中读取awk命令。

格式符	描述
%c	显示字符的ASCII码
%d,%i	显示十进制整数
%e,%E	科学计数法数值显示
%f	显示为浮点数
%g,%G	以科学计数法或浮点形式显示数值
%s	显示字符串
%u	无符号整数
%%	显示%自身

修饰符	描述
m[.n]	m表示控制显示的宽度,默认右对齐;n表示小数点后的精度
–	左对齐
+	显示数值的符号

变量名	描述
FS	input field seperator ,指定输入分隔符,默认为空白字符
OFS	output field seperator,指定输出分隔符,默认为空白字符
RS	input record seperator,指定输入行分隔符
ORS	output record seperator,指定输出行分隔符
NF	number of field,字段数量
{print NF}	打印统计的字段数量
{print $NF}	打印每行的最后一字段
NR	number of record,行数
FNR	多文件统计,各文件分别计数,显示行数
FILENAME	当前文件名
ARGC	命令行参数的个数
ARGV	命令行中给定的各参数

函数表达式	描述
rand()	返回0-1之间的随机数,小数
length([$])	返回指定字符串的长度
sub(r,s,[t])	以r表示的模式来查找t所表示的字符串中的匹配的内容,并将其第一次出现替换为s所表示的内容
gsub(r,s,[t])	以r表示的模式来查找t所表示的字符串中的匹配的内容,并将其所有出现全部替换为s所表示的内容
split(s,a[,r])	以r为分隔符切割字符s,并将切割后的结果保存在a所表示的数组中

运算符	描述
= += -= = /= %= ^= *=	赋值
?:	C条件表达式
\|\|	逻辑或
&&	逻辑与
~	匹配正则表达式
~!	不匹配正则表达式
< <= > >= != ==	关系运算符
空格	连接
+ –	加，减
* / &	乘，除与求余
+ – !	一元加，减和逻辑非
^ ***	求幂
++ –	增加或减少，作为前缀或后缀
$	字段引用
in	数组成员

模式	描述
empty	空模式,匹配每一行
BEGIN{}	仅在开始处理文件中的文本之前执行一次
END{}	仅在文本处理完成之后执行一次
/regular expression/	仅处理能够被此处模式匹配到的行
relational expression	关系表达式,结果有"真"有"假",结果为"真"才会被处理,真:结果为非0值,非空字符串
line ranges	行范围,startline,endline:/pat1/,/pat2/或(NR>=startline&&NR<=endline)

找出系统上默认shell为/bin/bash的用户，并输出该用户的用户名

awk -F: '{if ($NF == "/bin/bash")print $1}' /etc/passwd

找出系统上默认shell为bash的用户，并输出该用户的用户名

awk -F: '{if ($NF~"bash$")print $1}' /etc/passwd

输出当前系统上fstab挂载的设备情况

awk  '{if ($1!="#")print $0}' /etc/fstab

输出当前系统使用比例超过80%的分区

df -h |awk -F% '/\/dev/{print $1}'|awk '{if ($NF>80)print $1}'

if(condition){statements} else {statements}

找出系统上UID大于等于1000的用户，并将用户输出形式类似于“Conmon user： gwx”，其余用户输出形式类似于“Sysuser：php”

awk -F: '{if ($3>=1000) {printf "Common user: %s\n",$1} else {printf "Sysuser: %s\n",$1}}' /etc/passwd

while (condition){statements}

输出当前系统/etc/grub2.cfg文件中以linux16开头的行的字符数大于等于7个的字段，并在字段的后面显示该字段的字符数

awk '/^[[:space:]]*linux16/{i=1;while (i<=NF){if (length($i)>=7){print $i,length($i)};i++}}' /etc/grub2.cfg

for(expr1;expr2;expr3){statements}

输出当前系统/etc/grub2.cfg文件中以linux16开头的行字段，并在字段的后面显示该字段的字符数

awk '/^[[:space:]]*linux16/{for (i=1;i<=NF;i++){print $i,length($i)}}' /etc/grub2.cfg

awk入门应用

awk概述

使用语法

常用命令选项

相关输出命令

print item1,item2,…

printf FORMAT,item1,item2,….

相关格式符

相关修饰符

相关内建变量

相关内置函数

相关操作符

相关模式

相关控制语句及示例

if(condition) statements

if(condition){statements} else {statements}

while (condition){statements}

for(expr1;expr2;expr3){statements}

相关扩展 针对与使用awk统计网站访问相关

统计访问频次最高的5个ip

统计恶意ip

找出访问最多的文件(下载类网站常用,这里以.exe扩展名举例)

统计该网站的流量,统计结果以“G“”显示

查看日志中出现100次以上的IP

查看某一IP在网站内都访问了哪些资源

相关推荐

用户、组及文件相关的一些命令

密码保护：第二天

第四周

进程与计划任务

Linux任务计划和周期性任务执行

磁盘管理及文件系统

分享到:

相关扩展针对与使用awk统计网站访问相关