[Linux] awk命令详解

awk用于格式化报文或者从文件中抽取数据包．

1.$awk '{print $0}' gefforey.txt | tee gefforey.doc

该命令将在屏幕输出gefforey.txt文件内容并将其内容复制到gefforey.doc文件中．

2.$awk -F: '{print $1}' gefforey.log

该命令以:为单位读取gefforey.log文件中第一列内容．

３.$awk 'BEGIN {print "Name Belt\n------------"} {print $1"\t"$3}' gefforey.txt

该命令将在屏幕首先输出"Name Belt"，第二行输出"------------"，并在输出文件内容的时候，每列之间间隔一个TAB位．可以在print语句之后加上END {print "end of output"}，那么将会在文件内容输出结束的时候打印"end of output"．

4.$awk '$2 ~ /^baidu$/ {print $0}' gefforey.txt

该命令显示gefforey.txt文件中以空格分隔的第二列字符串是"baidu"的所有行．

5.$awk '{if($2 ~ /^baidu$/) print $0}' gefforey.txt

该命令判断如果某行第二列字符串为"baidu",则打印出该行．

6.$awk '{if($2 < $3) print $0}' gefforey.txt

该命令显示判断如果某行第二列值小于第三列值，则打印该行．awk的条件操作符有：

< 小于，> = 大于等于，< = 小于等于，~ 匹配正则表达式，= = 等于，!~ 不匹配正则表达式，!= 不等于

7.$awk '{if($2 =="google1" && $3=="google2") print $0}' gefforey.txt

该命令判断如果某行第二列值为"google1"并且第三列值为"google2"，则打印出该行．awk的逻辑表达式有：&& AND，|| O R，! 非．

8.$awk '{print NF,NR,$0} END{print FILENAME}' gefforey.txt

该命令会输出浏览记录的域个数和已读的记录数，并在输出结尾打印文件名．awk内置的变量有：

A R G C 命令行参数个数

A R G V 命令行参数排列

E N V I R O N 支持队列中系统环境变量的使用

FILENAME a w k浏览的文件名

F N R 浏览文件的记录数

F S 设置输入域分隔符，等价于命令行- F选项

N F 浏览记录的域个数

N R 已读的记录数

O F S 输出域分隔符

O R S 输出记录分隔符

R S 控制记录分隔符

（附：1.N F的一个强大功能是将变量$ P W D的返回值传入a w k并显示其目录。这里需要指定域分隔

符/．命令为：echo $PWD | awk -F/ '{print $NF}';

2.显示文件名，命令为：echo "/usr/local/etc/rc.sybase" | awk -F/ '{print $NF}'．

9.$awk '{name=$1; belt=$3;if(belt ~ /yellow/) print name "is belt" belt }' gefforey.txt

该命令将第一列的值赋给变量name,第三行的值赋给变量belt，并打印语句．awk允许在语句中进行赋值操作，赋值操作符有：=， +=， *=， / =， %=， ^ = ．

10.$awk 'gsub(/111/,222) {print $0}' gefforey.txt

该命令将文件中所有包含111的数字替换为222，awk的内置函数有：

g s u b ( r, s ) 在整个$ 0中用s替代r

g s u b ( r, s , t ) 在整个t中用s替代r

i n d e x ( s , t ) 返回s中字符串t的第一位置

l e n g t h ( s ) 返回s长度

m a t c h ( s , r ) 测试s是否包含匹配r的字符串

s p l i t ( s , a , f s ) 在f s上将s分成序列a

s p r i n t ( f m t , e x p ) 返回经f m t格式化后的e x p

s u b ( r, s ) 用$ 0中最左边最长的子串代替s

s u b s t r ( s , p ) 返回字符串s中从p开始的后缀部分

s u b s t r ( s , p , n ) 返回字符串s中从p开始长度为n的后缀部分

g s u b函数有点类似于s e d查找和替换。它允许替换一个字符串或字符为另一个字符串或字

符，并以正则表达式的形式执行。第一个函数作用于记录$ 0，第二个g s u b函数允许指定目标，

然而，如果未指定目标，缺省为$ 0。

i n d e x（s，t）函数返回目标字符串s中查询字符串t的首位置。l e n g t h函数返回字符串s字符

长度。m a t c h函数测试字符串s是否包含一个正则表达式r定义的匹配。s p l i t使用域分隔符f s将

字符串s划分为指定序列a。s p r i n t函数类似于p r i n t f函数（以后涉及），返回基本输出格式f m t的

结果字符串e x p。s u b（r，s）函数将用s替代$ 0中最左边最长的子串，该子串被（ r）匹配。

s u b（s，p）返回字符串s在位置p后的后缀。s u b s t r（s，p，n）同上，并指定子串长度为n。

11.$echo "65" | awk '{printf "//%c\n",$0}'

该命令管道输出65到awk，并观察其ASCII字符．awk的printf函数格式如下：

% c A S C I I字符

% d 整数

% e 浮点数，科学记数法

% f 浮点数，例如（1 2 3 . 4 4）

% g a w k决定使用哪种浮点数转换e或者f

% o 八进制数

% s 字符串

% x 十六进制数

awk命令也许是linux系统中最为复杂的命令，需要好好的练习！

本文转自demoblog博客园博客，原文链接http://www.cnblogs.com/0616--ataozhijia/p/3748462.html如需转载请自行联系原作者

demoblog

[Linux] awk命令详解

继续阅读

Java String.format方法的简单使用

neo4j之cypher使用文档

GitHub连夜封杀！这份阿里 10W 字内部 Java 字面试手册到底有多强？

spark/scala关于【资源文件】加载方法概述外部文件加载方案测试资源文件打包入jar包中小结

mybatis_入门程序Mybatis入门

samba服务器的功能

AOP编程_Android优雅权限框架(1)概念基础，2021金三银四前言正文大纲正文

Effective Java 8:通用程序设计

【Linux】UDP广播报文接收速率问题

OOM三种类型

工厂模式-三种类型

【递归】高效率求2的n次幂

win10本地scala和spark安装安装scala安装spark

Linux设备模型（中）之上层容器

scala (3) Function 和 Method

PowerPC平台 Linux移植三