第三周学习总结之简单文本处理

写在最前

通过前面的学习,我们已经知道Linux是一个一切皆文件的系统,因此对文件的处理就显得尤为重要,到目前为止,对于新手来说可能连鼎鼎大名的三剑客也未必听过,不过在这之前我们也可以使用一些非常好用的文本处理工具来完成一些简单文件的处理。本次内容就是讲讲如何使用几个简单文本处理工具的组合完成一些实用的功能。

文本处理工具

文本处理工具,用我的理解就是能够对指定文本就行相应处理,提取输出我们想要的结果。沿着这个思想,我们就来挖一挖这些工具,通过挖掘,下一些好用的命令就被我们给发现了,下面就给您慢慢讲讲他们都有哪些。

sort

功能描述:用于对文本进行排序。

语    法:sort   [OPTION]… FILE…

选    项

  • -f: 忽略字符大小写;
  • -t: 指定分隔符,默认为tab, -t “:”表示使用:为分割符;
  • -k: 指定分隔之后要进行排序比较的字段;
  • -n: 使用纯数字进行排序;
  • -u: 排序后去重,表示相同的数据只显示一行;
  • -b:忽略最前面的空格符部分

uniq

功能描述:略去重复的行。

语    法:uniq [OPTION]… [INPUT [OUTPUT]]

选    项

  • -d:只显示存在重复的行;
  • -u:只显示不重复的行;
  • -c: 显示文件中行重复的次数;
  • -i:忽略大小写;

wc

功能描述:统计文件的单词数、字符数。

语    法:wc [OPTION]… [FILE]…

选    项

  • -l:列出行数;
  • -w:列出字(英文单字);
  • -c:列出字符数(字节数)

cut

功能描述:删除文件每行中的特定部分。

语    法:cut OPTION… [FILE]…

选    项

  • -d: 指定分隔符;
  • -f: 依据-d将信息分段,取第几段的意思;
  • -c:以字符取出固定区间;

tr

功能描述:翻译或删除字符。

语    法:tr [OPTION]… SET1 [SET2]

选    项

  • -d: 删除指定内容;

示例演示

通过上面的讲解,你可能还是一头雾水,不要着急,下面的时间不是下课时间,而是练习时间,而且条条大路通罗马,只要能达到目的,不管你用哪一种方法实现,都是OK的,好了,那就开始吧!

首先呢,需要说明的是后面的很多处理就不会是单一命令的实现,你可能需要结合前面所学的知识将多个命令组合起来使用。

(1)、列出当前系统上所有已经登录的用户的用户名且同一个用户登录多次,则只显示一次。

通过分析此题啊,首先要知道who命令是查看系统上的登陆用户,并且还要取出他们的用户名,也即是取出特定字段,这里可以使用cut命令,最后就是去重,通过上面的讲解,我们知道sort有个参数就是去重的。有了解题思路,接下来就正式解题吧。

who|who|cut -d ” ” -f1|sort -u

301

(2)、取出最后登录到当前系统的用户的相关信息。

通过前面的学习,使用last命令就可以查看登录到系统的用户,通过查看登录文件格式,可以发现最后登录的反而实在第一行显示,再使用cut命令截取出用户名就可以查看此用户的完整信息了。

last|head -1|cut -d ” ” -f1|id

302

(3)、取出当前系统上被用户当做其默认shell的最多的那个shell。

在上一篇中我们说到用户的完整信息保存在/etc/passwd文件中,因此此题的信息就可以在此文件中获取,在通过上面的文件处理命令辅助就可以完成要求。

cut -d ‘:’ -f 7 /etc/passwd|sort -r|uniq -c|sort -nr|head -1

303

(4)、将/etc/passwd中的第三个字段值最大的后10个用户的信息全部改为大写后保存至/tmp/maxusers.txt中。

这里明确给出了以passwd文件的第三个字段就行排序,改为大写不就是tr命令的功能么。

sort -t ‘:’ -k3n /etc/passwd|tail -10|tr ‘a-z’ ‘A-Z’>/tmp/maxusers.txt

304

(5)、取出当前主机的IP地址。

此题也是通过对ifconfig命令取到的结果进行信息切分,取出其中的IP地址。

ifconfig ens33|grep “netmask”|cut -c 13-26

305

(6)、列出/etc目录下所有以.conf结尾的文件的文件名,并将其名字转换为大写后保存至/tmp/etc.conf文件中。

此题也是先要找出要求的文件,然后进行大小写转换即可。

ls /etc/|grep -E ‘.conf$’ |tr ‘a-z’ ‘A-Z’ >/tmp/etc.conf

306

(7)、显示/var目录下一级子目录或文件的总个数。

此处主要用到wc统计个数的功能。

ls /var/|wc -l

307

(8)、取出/etc/group文件中第三个字段数值最小的10个组的名字。

此题上题中的题4类似,大致方法可参照题4。

sort -t ‘:’ -k3n /etc/group|head -10|cut -d ‘:’ -f 1

308

(9)、将/etc/fsteab和/etc/issus文件的内容合并为同一个内容后保存至/tmp/etc.test文件中。

此题读取同一目录下的两个文件可以使用命令行展开方式。

cat /etc/{fstab,issue} >/tmp/etc.test

309

今天的练习就差不多这些了,您学会了么,其他很多看似复杂的问题进行分解,最终都是由一个一个命令组合而来的,就像Linux一样,由众多功能单一的小程序组合完成一个复杂的大程序。因此,我们遇到问题要学会剖析分析,这样才能在杂乱无章中抽丝剥茧,最终出色的完成任务。

本文来自投稿,不代表Linux运维部落立场,如若转载,请注明出处:http://www.178linux.com/90427

(0)
虫草君虫草君
上一篇 2017-12-19 21:05
下一篇 2017-12-19

相关推荐

  • N26-博客作业-week13

    1、建立samba共享,共享目录为/data,要求:(描述完整的过程)  1)共享名为shared,工作组为magedu;  2)添加组develop,添加用户gentoo,centos和ubuntu,其中gentoo和centos以develop为附加组,ubuntu不属于develop组;密码均为用户名;  3)添加samb…

    Linux干货 2017-06-15
  • yum函数介绍以及自建yum仓库

    一、前言     在之前介绍了yum的配置(详细请移步 http://www.178linux.com/archives/6445)。但是有没有发现一个问题,虽然我们已将仓库指向一个可用的仓库服务器,但是随着Linux的不断升级和改版,我们是否还需要不断的去修改仓库的配置文件,如果只有一台还好,那如果我们有多…

    Linux干货 2015-07-24
  • 集中练习4-bash脚本、计划任务

    集中练习4-bash脚本、计划任务

    Linux干货 2017-10-27
  • linux下安装配置DHCP服务器

    前提是已经安装了 core 及 base 两个组   1 2 3 4 5 # cat /etc/redhat-release   Red Hat Enterprise Linux Server release 6.8 (Santiago)&…

    Linux干货 2017-05-03
  • 群集简介和LVS_nat模式配置

    群集简介: 群集(或集群)和称呼来自于英文单词cluster,表示一群、一串的意思,用在服务器领域则表示大量服务器的集合体,以区分于单个服务器。 根据实际企业环境的不同,群集所提供的功能也各不相同,采用的技术细节也可能各有千秋,但无论哪种群集,都至少包括两台节点服务器。而对外表现为一个整体,只提供一个访问入口(域名或IP地址),相当于一台大型计算机。根据群集…

    Linux干货 2017-02-13
  • GOPS2017全球运维大会 • 深圳站将在深圳召开!

    第六届GOPS2017全球运维大会(本次)将于2017年4月21日-22日在深圳举行,历届金牌讲师精选亮相,各种精彩等您发掘。活动家为GOPS2017全球运维大会提供在线报名!在线报名地址:https://www.huodongjia.com/event-231365274.html 大会亮点 众多国外重量级嘉宾在路上 ► 目前正在和各位大咖商榷行程中,主会…

    2017-04-10

评论列表(1条)

  • 马哥教育
    马哥教育 2018-01-07 17:19

    赞,排版比较清晰,最后部分也有自己思考的部分,很赞~~继续加油。