From c53511c25028b5ddfc1f7fb8d6e88d92beacbea0 Mon Sep 17 00:00:00 2001 From: Xingyu Wang Date: Mon, 5 Oct 2020 10:07:33 +0800 Subject: [PATCH 1/2] PRF @HankChow --- ...00903 A practical guide to learning awk.md | 41 ++++++++----------- 1 file changed, 17 insertions(+), 24 deletions(-) diff --git a/translated/tech/20200903 A practical guide to learning awk.md b/translated/tech/20200903 A practical guide to learning awk.md index 50a5f6d1d3..2507ecc6d5 100644 --- a/translated/tech/20200903 A practical guide to learning awk.md +++ b/translated/tech/20200903 A practical guide to learning awk.md @@ -1,6 +1,6 @@ [#]: collector: (lujun9972) [#]: translator: (HankChow) -[#]: reviewer: ( ) +[#]: reviewer: (wxy) [#]: publisher: ( ) [#]: url: ( ) [#]: subject: (A practical guide to learning awk) @@ -9,20 +9,21 @@ awk 实用学习指南 ====== -下载我们的电子书,学习如何更好地使用 `awk`。 -![Person programming on a laptop on a building][1] + +> 下载我们的电子书,学习如何更好地使用 `awk`。 + +![](https://img.linux.net.cn/data/attachment/album/202010/05/100648zcubcpww627627nw.jpg) 在众多 [Linux][2] 命令中,`sed`、`awk` 和 `grep` 恐怕是其中最经典的三个命令了。它们引人注目或许是由于名字发音与众不同,也可能是它们无处不在,甚至是因为它们存在已久,但无论如何,如果要问哪些命令很有 Linux 风格,这三个命令是当之无愧的。其中 `sed` 和 `grep` 已经有很多简洁的标准用法了,但 `awk` 的使用难度却相对突出。 -在日常使用中,通过 `sed` 实现字符串替换、通过 `grep` 实现过滤,这些都是司空见惯的操作了,但 `awk` 命令相对来说是用得比较少的。在我看来,可能的原因是大多数人都只使用 `sed` 或者 `grep` 的一些变体实现某些功能,例如: - +在日常使用中,通过 `sed` 实现字符串替换、通过 `grep` 实现过滤,这些都是司空见惯的操作了,但 `awk` 命令相对来说是用得比较少的。在我看来,可能的原因是大多数人都只使用 `sed` 或者 `grep` 的一些变化实现某些功能,例如: ``` $ sed -e 's/foo/bar/g' file.txt $ grep foo file.txt ``` -因此,尽管你可能会觉得 `sed` 和 `grep` 使用起来更加顺手,但实际上它们还有更多更强大的作用没有发挥出来。当然,我们没有必要在这两个命令上钻研得很深入,但我还是想理解自己是如何学习一个命令的。很多时候我会把一整串命令记住,但不会去了解其中的运行过程,这就让我产生了一种很熟悉命令的错觉,我可以随口说出某个命令的好几个选项参数,但这些参数具体有什么作用,以及它们的相关语法,我都并不明确。 +因此,尽管你可能会觉得 `sed` 和 `grep` 使用起来更加顺手,但实际上它们还有更多更强大的作用没有发挥出来。当然,我们没有必要在这两个命令上钻研得很深入,但我有时会好奇自己“学习”命令的方式。很多时候我会记住一整串命令“咒语”,而不会去了解其中的运作过程,这就让我产生了一种很熟悉命令的错觉,我可以随口说出某个命令的好几个选项参数,但这些参数具体有什么作用,以及它们的相关语法,我都并不明确。 这大概就是很多人对 `awk` 缺乏了解的原因了。 @@ -34,7 +35,6 @@ $ grep foo file.txt `awk` 的本质是将输入的内容看作是一个数组。当 `awk` 扫描一个文本文件时,会把每一行作为一条记录record,每一条记录中又分割为多个字段field。`awk` 记录了各条记录各个字段的信息,并通过内置变量 `NR`(记录数) 和 `NF`(字段数) 来调用相关信息。例如一下这个命令可以查看文件的行数: - ``` $ awk 'END { print NR;}' example.txt 36 @@ -42,15 +42,13 @@ $ awk 'END { print NR;}' example.txt 从上面的命令可以看出 `awk` 的基本语法,无论是一个单行命令还是一整个脚本,语法都是这样的: - ``` -`样式或关键字 { 操作 }` +模式或关键字 { 操作 } ``` -在上面的例子中,`END` 是一个关键字而不是样式,与此类似的另一个关键字是 `BEGIN`。使用 `BEGIN` 或 `END` 可以让 `awk` 在解析内容前或解析内容后执行大括号中指定的操作。 - -你可以使用样式pattern作为过滤器或限定符,这样 `awk` 只会对匹配样式的对应记录执行指定的操作。以下这个例子就是使用 `awk` 实现 `grep` 命令在文件中查找“Linux”字符串的功能: +在上面的例子中,`END` 是一个关键字而不是模式,与此类似的另一个关键字是 `BEGIN`。使用 `BEGIN` 或 `END` 可以让 `awk` 在解析内容前或解析内容后执行大括号中指定的操作。 +你可以使用模式pattern作为过滤器或限定符,这样 `awk` 只会对匹配模式的对应记录执行指定的操作。以下这个例子就是使用 `awk` 实现 `grep` 命令在文件中查找“Linux”字符串的功能: ``` $ awk '/Linux/ { print $0; }' os.txt @@ -62,8 +60,7 @@ OS: Elementary Linux (10.1.2.5) OS: Elementary Linux (10.1.2.6) ``` -`awk` 会将文件中的每一行作为一条记录,将一条记录中的每个单词作为一个字段,默认情况下会按照空格作为分隔符field separator(`FS`)切割出记录中的字段。如果想要使用其它内容作为分隔符,可以使用 `--field-separator` 选项指定分隔符: - +`awk` 会将文件中的每一行作为一条记录,将一条记录中的每个单词作为一个字段,默认情况下会以空格作为字段分隔符field separator(`FS`)切割出记录中的字段。如果想要使用其它内容作为分隔符,可以使用 `--field-separator` 选项指定分隔符: ``` $ awk --field-separator ':' '/Linux/ { print $2; }' os.txt @@ -77,7 +74,6 @@ $ awk --field-separator ':' '/Linux/ { print $2; }' os.txt 在上面的例子中,可以看到在 `awk` 处理后每一行的行首都有一个空格,那是因为在源文件中每个冒号(`:`)后面都带有一个空格。和 `cut` 有所不同的是,`awk` 可以指定一个字符串作为分隔符,就像这样: - ``` $ awk --field-separator ': ' '/Linux/ { print $2; }' os.txt CentOS Linux (10.1.1.8) @@ -92,26 +88,23 @@ Elementary Linux (10.1.2.6) 可以通过这样的语法在 `awk` 中自定义函数: - ``` -`函数名称(参数) { 操作 }` +函数名称(参数) { 操作 } ``` -函数的好处在于只需要编写一次就可以多次复用,因此函数在脚本中起到的作用会比在构造单行命令时大。同时 `awk` 自身也带有很多预定义的函数,并且工作原理和其它编程语言或电子表格保持一致。你只需要了解函数需要接受什么参数,就可以放心使用了。 +函数的好处在于只需要编写一次就可以多次复用,因此函数在脚本中起到的作用会比在构造单行命令时大。同时 `awk` 自身也带有很多预定义的函数,并且工作原理和其它编程语言或电子表格一样。你只需要了解函数需要接受什么参数,就可以放心使用了。 `awk` 中提供了数学运算和字符串处理的相关函数。数学运算函数通常比较简单,传入一个数字,它就会传出一个结果: - ``` $ awk 'BEGIN { print sqrt(1764); }' 42 ``` -而字符串处理函数则稍微复杂一点,但 [GNU awk 手册][3]中也有充足的文档。例如 `split()` 函数需要传入一个待分割的单一字段、一个数组用于存放分割结果,以及用于分割的定界符delimiter。 +而字符串处理函数则稍微复杂一点,但 [GNU awk 手册][3]中也有充足的文档。例如 `split()` 函数需要传入一个待分割的单一字段、一个用于存放分割结果的数组,以及用于分割的定界符delimiter。 例如前面示例中的输出内容,每条记录的末尾都包含了一个 IP 地址。由于变量 `NF` 代表的是每条记录的字段数量,刚好对应的是每条记录中最后一个字段的序号,因此可以通过引用 `NF` 将每条记录的最后一个字段传入 `split()` 函数: - ``` $ awk --field-separator ': ' '/Linux/ { split($NF, IP, "."); print "subnet: " IP[3]; }' os.txt subnet: 1 @@ -122,13 +115,13 @@ subnet: 2 subnet: 2 ``` -实际上 `awk` 的功能还远远不止于此,你还可以跳出 `awk` 本身,通过命令管道和脚本来自定义更多功能。 +还有更多的函数,没有理由将自己限制在每个 `awk` 代码块中。你可以在终端中使用 `awk` 构建复杂的管道,也可以编写 `awk` 脚本来定义和使用你自己的函数。 ### 下载电子书 使用 `awk` 本身就是一个学习 `awk` 的过程,即使某些操作使用 `sed`、`grep`、`cut`、`tr` 命令已经完全足够了,也可以尝试使用 `awk` 来实现。只要熟悉了 `awk`,就可以在 Bash 中自定义一些 `awk` 函数,进而解析复杂的数据。 -[下载我们的电子书][4]学习并开始使用 `awk` 吧! +[下载我们的这本电子书][4](需注册)学习并开始使用 `awk` 吧! -------------------------------------------------------------------------------- @@ -137,7 +130,7 @@ via: https://opensource.com/article/20/9/awk-ebook 作者:[Seth Kenlon][a] 选题:[lujun9972][b] 译者:[HankChow](https://github.com/hankchow) -校对:[校对者ID](https://github.com/校对者ID) +校对:[wxy](https://github.com/wxy) 本文由 [LCTT](https://github.com/LCTT/TranslateProject) 原创编译,[Linux中国](https://linux.cn/) 荣誉推出 From 8cec5bb666174a3922fe9c91fe3df65127d93a2e Mon Sep 17 00:00:00 2001 From: Xingyu Wang Date: Mon, 5 Oct 2020 10:08:03 +0800 Subject: [PATCH 2/2] PUB @HankChow https://linux.cn/article-12686-1.html --- .../20200903 A practical guide to learning awk.md | 4 ++-- 1 file changed, 2 insertions(+), 2 deletions(-) rename {translated/tech => published}/20200903 A practical guide to learning awk.md (99%) diff --git a/translated/tech/20200903 A practical guide to learning awk.md b/published/20200903 A practical guide to learning awk.md similarity index 99% rename from translated/tech/20200903 A practical guide to learning awk.md rename to published/20200903 A practical guide to learning awk.md index 2507ecc6d5..66c613a352 100644 --- a/translated/tech/20200903 A practical guide to learning awk.md +++ b/published/20200903 A practical guide to learning awk.md @@ -1,8 +1,8 @@ [#]: collector: (lujun9972) [#]: translator: (HankChow) [#]: reviewer: (wxy) -[#]: publisher: ( ) -[#]: url: ( ) +[#]: publisher: (wxy) +[#]: url: (https://linux.cn/article-12686-1.html) [#]: subject: (A practical guide to learning awk) [#]: via: (https://opensource.com/article/20/9/awk-ebook) [#]: author: (Seth Kenlon https://opensource.com/users/seth)