TranslateProject/published/202202/20220116 Solve Wordle using the Linux command line.md

163 lines
7.1 KiB
Markdown
Raw Permalink Normal View History

2022-02-07 08:50:12 +08:00
[#]: subject: "Solve Wordle using the Linux command line"
[#]: via: "https://opensource.com/article/22/1/word-game-linux-command-line"
[#]: author: "Jim Hall https://opensource.com/users/jim-hall"
[#]: collector: "lujun9972"
[#]: translator: "geekpi"
[#]: reviewer: "wxy"
[#]: publisher: "wxy"
[#]: url: "https://linux.cn/article-14253-1.html"
2022-02-07 08:50:12 +08:00
用 Linux 命令行解决 Wordle 问题
======
> 使用 Linux 的 grep 和 fgrep 命令来赢得你最喜欢的基于单词的猜测游戏。
2022-02-07 08:50:12 +08:00
![Linux keys on the keyboard for a desktop computer][1]
我最近有点迷恋上了一个在线单词猜谜游戏,在这个游戏中,你有六次机会来猜一个随机的五个字母的单词。这个词每天都在变化,而且你每天只能玩一次。每次猜测后,你猜测中的每个字母都会被高亮显示:灰色表示该字母没有出现在神秘单词中,黄色表示该字母出现在单词中,但不在那个位置,绿色表示该字母出现在单词中的那个正确位置。
下面是你如何使用 Linux 命令行来帮助你玩像 Wordle 这样的猜测游戏。我用这个方法来帮助我解决 1 月 6 日的谜题:
### 第一次尝试
Linux 系统在 `/usr/share/dict/words` 文件中保存了一个单词词典。这是一个很长的纯文本文件。我的系统的单词文件里有超过 479,800 个条目。该文件既包含纯文本,也包含专有名词(名字、地点等等)。
2022-02-07 08:50:12 +08:00
为了开始我的第一次猜测,我只想得到一个长度正好是五个字母的纯文本词的列表。要做到这一点,我使用这个 `grep` 命令:
```
$ grep '^[a-z][a-z][a-z][a-z][a-z]$' /usr/share/dict/words > myguess
2022-02-07 08:50:12 +08:00
```
`grep` 命令使用正则表达式来进行搜索。你可以用正则表达式做很多事情,但为了帮助我解决 Wordle 问题,我只需要基本的东西。`^` 表示一行的开始,`$` 表示一行的结束。在两者之间,我指定了五个 `[a-z]` 的实例,表示从 a 到 z 的任何小写字母。
我还可以使用 `wc` 命令来查看我的可能单词列表,“只有” 15,000 个单词:
```
$ wc -l myguess
15034 myguess
```
从这个列表中,我随机挑选了一个五个字母的单词:`acres`。`a` 被设置为黄色,意味着该字母存在于神秘单词的某处,但不在第一位置。其他字母是灰色的,所以我知道它们并不存在于今天的单词中。
2022-02-07 08:50:12 +08:00
![acres word attempt][2]
### 第二次尝试
对于我的下一个猜测,我想得到一个包含 `a` 的所有单词的列表,但不是在第一位置。我的列表也不应该包括字母 `c`、`r`、`e` 或 `s`。让我们把这个问题分解成几个步骤。
2022-02-07 08:50:12 +08:00
为了得到所有带 a 的单词的列表,我使用 `fgrep`(固定字符串 grep命令。`fgrep` 命令也像 `grep` 一样搜索文本,但不使用正则表达式:
```
$ fgrep a myguess > myguess2
2022-02-07 08:50:12 +08:00
```
这使我的下一个猜测的可能列表从 15,000 个字下降到 6,600 个字:
```
$ wc -l myguess myguess2
15034 myguess
6634 myguess2
21668 total
```
但是这个单词列表中的第一个位置也有字母 `a`,这是我不想要的。游戏已经表明字母 `a` 存在于其他位置。我可以用 `grep` 修改我的命令,以寻找在第一个位置包含其他字母的词。这就把我可能的猜测缩小到了 5500 个单词:
2022-02-07 08:50:12 +08:00
```
$ fgrep a myguess | grep '^[b-z]' > myguess2
2022-02-07 08:50:12 +08:00
$ wc -l myguess myguess2
15034 myguess
5566 myguess2
20600 total
```
但我知道这个神秘的词也不包括字母 `c`、`r`、`e` 或 `s`。我可以使用另一个 `grep` 命令,在搜索中省略这些字母:
2022-02-07 08:50:12 +08:00
```
$ fgrep a myguess | grep '^[b-z]' | grep -v '[cres]' > myguess2
2022-02-07 08:50:12 +08:00
$ wc -l myguess myguess2
15034 myguess
1257 myguess2
16291 total
```
`-v` 选项意味着反转搜索,所以 `grep` 将只返回不符合正则表达式 `[cres]` 或单列字母 `c`、`r`、`e` 或 `s` 的行。有了这个额外的 `grep` 命令,我把下一个猜测的范围大大缩小到只有 1200 个可能的单词,这些单词在某处有一个 `a`,但不在第一位置,并且不包含 `c`、`r`、`e`、或 `s`
2022-02-07 08:50:12 +08:00
在查看了这个列表后,我决定尝试一下 `balmy` 这个词。
2022-02-07 08:50:12 +08:00
![balmy word attempt][3]
### 第三次尝试
这一次,字母 `b``a` 被高亮显示为绿色,意味着我把这些字母放在了正确的位置。字母 `l` 是黄色的,所以这个字母存在于单词的其他地方,但不是在那个位置。字母 `m``y` 是灰色的,所以我可以从我的下一个猜测中排除这些。
2022-02-07 08:50:12 +08:00
为了确定下一个可能的单词列表,我可以使用另一组 `grep` 命令。我知道这个词以 `ba` 开头,所以我可以从这里开始搜索:
2022-02-07 08:50:12 +08:00
```
$ grep '^ba' myguess2 > myguess3
2022-02-07 08:50:12 +08:00
$ wc -l myguess3
77 myguess3
```
这只有 77 个词! 我可以进一步缩小范围,寻找除第三位外还包含字母 `l` 的词:
2022-02-07 08:50:12 +08:00
```
$ grep '^ba[^l]' myguess2 > myguess3
2022-02-07 08:50:12 +08:00
$ wc -l myguess3
61 myguess3
```
方括号 `[^l]` 内的 `^` 表示不是这个字母列表,即不是字母 `l`。这使我的可能单词列表达到 61 个,并非所有的单词都包含字母 `l`,我可以用另一个 `grep` 搜索来消除这些单词:
2022-02-07 08:50:12 +08:00
```
$ grep '^ba[^l]' myguess2 | fgrep l > myguess3
2022-02-07 08:50:12 +08:00
$ wc -l myguess3
10 myguess3
```
这些词中有些可能包含字母 `m``y`,而这些字母并不在今天的神秘词中。我可以再进行一次反转 `grep` 搜索,将它们从我的猜测列表中删除:
2022-02-07 08:50:12 +08:00
```
$ grep '^ba[^l]' myguess2 | fgrep l | grep -v '[my]' > myguess3
2022-02-07 08:50:12 +08:00
$ wc -l myguess3
7 myguess3
```
我的可能的单词列表现在非常短,只有七个单词!
```
$ cat myguess3
babul
bailo
bakal
bakli
banal
bauld
baulk
```
我选择 `banal` 作为我下一次猜测的可能的词,而这恰好是正确的。
2022-02-07 08:50:12 +08:00
![banal word attempt][4]
### 正则表达式的力量
Linux 的命令行提供了强大的工具来帮助你完成实际工作。`grep` 和 `fgrep` 命令在扫描单词列表方面提供了极大的灵活性。对于一个基于单词的猜测游戏,`grep` 帮助识别了一个包含 15000 个可能的单词的列表。在猜测并知道哪些字母出现在神秘的单词中,哪些没有,`grep` 和 `fgrep` 帮助将选项缩小到 1200 个单词,然后只剩下 7 个单词。这就是命令行的力量。
2022-02-07 08:50:12 +08:00
--------------------------------------------------------------------------------
via: https://opensource.com/article/22/1/word-game-linux-command-line
作者:[Jim Hall][a]
选题:[lujun9972][b]
译者:[geekpi](https://github.com/geekpi)
校对:[wxy](https://github.com/wxy)
2022-02-07 08:50:12 +08:00
本文由 [LCTT](https://github.com/LCTT/TranslateProject) 原创编译,[Linux中国](https://linux.cn/) 荣誉推出
[a]: https://opensource.com/users/jim-hall
[b]: https://github.com/lujun9972
[1]: https://opensource.com/sites/default/files/styles/image-full-size/public/lead-images/linux_keyboard_desktop.png?itok=I2nGw78_ (Linux keys on the keyboard for a desktop computer)
[2]: https://opensource.com/sites/default/files/acres.png (acres word attempt)
[3]: https://opensource.com/sites/default/files/balmy.png (balmy word attempt)
[4]: https://opensource.com/sites/default/files/banal.png (banal word attempt)