PUB:20150518 Linux FAQs with Answers--How to block specific user agents on nginx web server

@GOLinux
This commit is contained in:
wxy 2015-05-21 23:03:34 +08:00
parent 92e6fbd286
commit 5d7da8621e

View File

@ -1,6 +1,6 @@
Linux有问必答——nginx网络服务器上如何阻挡特定用户代理
Linux有问必答nginx网络服务器上如何阻止特定用户代理UA
================================================================================
> **问题** 我注意到有一些机器人经常访问我nginx驱动的网站并且进行一些攻击性的扫描导致消耗掉了我的网络服务器的大量资源。我一直尝试着通过用户代理符串来阻挡这些机器人。我怎样才能在nginx网络服务器上阻挡掉特定的用户代理呢
> **问题** 我注意到有一些机器人经常访问我nginx驱动的网站并且进行一些攻击性的扫描导致消耗掉了我的网络服务器的大量资源。我一直尝试着通过用户代理符串来阻挡这些机器人。我怎样才能在nginx网络服务器上阻挡掉特定的用户代理呢
现代互联网滋生了大量各种各样的恶意机器人和网络爬虫,比如像恶意软件机器人、垃圾邮件程序或内容刮刀,这些恶意工具一直偷偷摸摸地扫描你的网站,干些诸如检测潜在网站漏洞、收获电子邮件地址,或者只是从你的网站偷取内容。大多数机器人能够通过它们的“用户代理”签名字符串来识别。
@ -10,7 +10,7 @@ Linux有问必答——nginx网络服务器上如何阻挡特定用户代理
### 在Nginx中将特定用户代理列入黑名单 ###
要配置用户代理阻挡列表请打开你的网站的nginx配置文件找到服务器定义部分。该文件可能会放在不同的地方这取决于你的nginx配置或Linux版本/etc/nginx/nginx.conf,/etc/nginx/sites-enabled/<your-site>,/usr/local/nginx/conf/nginx.conf,/etc/nginx/conf.d/<your-site>)。
要配置用户代理阻挡列表请打开你的网站的nginx配置文件找到`server`定义部分。该文件可能会放在不同的地方这取决于你的nginx配置或Linux版本`/etc/nginx/nginx.conf`,`/etc/nginx/sites-enabled/<your-site>`,`/usr/local/nginx/conf/nginx.conf`,`/etc/nginx/conf.d/<your-site>`)。
server {
listen 80 default_server;
@ -20,19 +20,19 @@ Linux有问必答——nginx网络服务器上如何阻挡特定用户代理
....
}
在打开该配置文件并找到 server 部分后,添加以下 if 声明到该部分内的某个地方。
在打开该配置文件并找到 `server` 部分后,添加以下 if 声明到该部分内的某个地方。
server {
listen 80 default_server;
server_name xmodulo.com;
root /usr/share/nginx/html;
# case sensitive matching
# 大小写敏感的匹配
if ($http_user_agent ~ (Antivirx|Arian) {
return 403;
}
# case insensitive matching
#大小写无关的匹配
if ($http_user_agent ~* (netcrawl|npbot|malicious)) {
return 403;
}
@ -41,7 +41,7 @@ Linux有问必答——nginx网络服务器上如何阻挡特定用户代理
}
如你所想,这些 if 声明使用正则表达式匹配了任意不良用户字符串并向匹配的对象返回403 HTTP状态码。
$http_user_agent是HTTP请求的一个包含有用户代理字符串的变量。~’操作符针对用户代理字符串进行大小写敏感匹配,而‘~*’操作符则进行大小写不敏感匹配。‘|’操作符是逻辑或,因此,你可以在 if 声明中放入众多的用户代理关键字,然后将它们全部阻挡掉。
`$http_user_agent`是HTTP请求的一个包含有用户代理字符串的变量。‘~’操作符针对用户代理字符串进行大小写敏感匹配,而‘~*’操作符则进行大小写无关匹配。‘|’操作符是逻辑或,因此,你可以在 if 声明中放入众多的用户代理关键字,然后将它们全部阻挡掉。
在修改配置文件后你必须重新加载nginx以激活阻挡
@ -55,7 +55,7 @@ $http_user_agent是HTTP请求的一个包含有用户代理字符串的变量。
### 管理Nginx中的用户代理黑名单 ###
目前为止我已经展示了在nginx中如何阻挡一些用户代理的HTTP请求。如果你有多不同类型的网络爬虫机器人要阻挡,又该怎么办呢?
目前为止我已经展示了在nginx中如何阻挡一些用户代理的HTTP请求。如果你有多不同类型的网络爬虫机器人要阻挡,又该怎么办呢?
由于用户代理黑名单会增长得很大所以将它们放在nginx的server部分不是个好点子。取而代之的是你可以创建一个独立的文件在该文件中列出所有被阻挡的用户代理。例如让我们创建/etc/nginx/useragent.rules并定义以下面的格式定义所有被阻挡的用户代理的图谱。
@ -100,7 +100,7 @@ $http_user_agent是HTTP请求的一个包含有用户代理字符串的变量。
$ sudo /path/to/nginx -s reload
现在,任何包含有/etc/nginx/useragent.rules中列出的关键字的用户代理将被nginx自动禁止。
现在,任何包含有`/etc/nginx/useragent.rules`中列出的关键字的用户代理将被nginx自动禁止。
--------------------------------------------------------------------------------
@ -108,7 +108,7 @@ via: http://ask.xmodulo.com/block-specific-user-agents-nginx-web-server.html
作者:[Dan Nanni][a]
译者:[GOLinux](https://github.com/GOLinux)
校对:[校对者ID](https://github.com/校对者ID)
校对:[wxy](https://github.com/wxy)
本文由 [LCTT](https://github.com/LCTT/TranslateProject) 原创翻译,[Linux中国](https://linux.cn/) 荣誉推出