mirror of
https://github.com/LCTT/TranslateProject.git
synced 2025-02-03 23:40:14 +08:00
Merge pull request #26483 from wxy/20220709-Monitoring-tiny-web-services
RP:published/20220709 Monitoring tiny web services.md
This commit is contained in:
commit
f7fdcfcaf5
@ -3,22 +3,24 @@
|
||||
[#]: author: "Julia Evans https://jvns.ca/"
|
||||
[#]: collector: "lujun9972"
|
||||
[#]: translator: "geekpi"
|
||||
[#]: reviewer: " "
|
||||
[#]: publisher: " "
|
||||
[#]: url: " "
|
||||
[#]: reviewer: "wxy"
|
||||
[#]: publisher: "wxy"
|
||||
[#]: url: "https://linux.cn/article-14840-1.html"
|
||||
|
||||
监测微型网络服务
|
||||
如何监测微型的网站服务
|
||||
======
|
||||
|
||||
![](https://img.linux.net.cn/data/attachment/album/202207/18/105829gzviausw5wg7wwxb.jpg)
|
||||
|
||||
你好! 我最近又开始运行一些服务器([nginx playground][1]、[mess with dns][2]、[dns lookup][3]),所以我一直在考虑监控问题。
|
||||
|
||||
最初我并不完全清楚如何监控这些网站,所以我想快速写下我是如何做到的。
|
||||
|
||||
我根本不打算谈如何监控大型严肃的关键任务网站,只谈微型的不重要的网站。
|
||||
我根本不打算谈如何监控大型的、严肃的关键任务网站,只谈微型的不重要的网站。
|
||||
|
||||
### 目标:在操作上几乎不花时间
|
||||
|
||||
我希望网站大部分时间都能正常工作,但我也希望在持续的运营上几乎不花时间。
|
||||
我希望网站大部分时间都能正常工作,但我也希望不用在持续的运营上花费时间。
|
||||
|
||||
我最初对运行服务器非常警惕,因为在我的上一份工作中,我是 24/7 轮流值班,负责一些关键的服务,在我的印象中,“负责服务器”意味着“在凌晨 2 点被叫起来修理服务器”和“有很多复杂的仪表盘”。
|
||||
|
||||
@ -32,16 +34,14 @@
|
||||
|
||||
### 步骤 1:uptime 检查器
|
||||
|
||||
第一步是建立一个 uptime 检查器。外面有很多这样的东西,我现在使用的是 [updown.io][4] 和 [uptime robot][5]。我更喜欢 updown 的用户界面和[定价][6]结构(它是按请求而不是按月收费),但u ptime robot 有一个更慷慨的免费套餐。
|
||||
第一步是建立一个 uptime 检查器。外面有很多这样的东西,我现在使用的是 [updown.io][4] 和 [uptime robot][5]。我更喜欢 updown 的用户界面和 [定价][6] 结构(它是按请求而不是按月收费),但 uptime 机器人有一个更慷慨的免费套餐。
|
||||
|
||||
它们会:
|
||||
|
||||
1. 检查网站是否正常
|
||||
2. 如果出现故障,它会给我发电子邮件
|
||||
|
||||
|
||||
|
||||
我发现电子邮件通知对我来说是一个很好的级别,如果网站宕机,我会很快发现,但它不会唤醒我或任何东西。
|
||||
我发现电子邮件通知对我来说是一个很好的通知级别,如果网站宕机,我会很快发现,但它不会吵醒我或做其它的什么打扰。
|
||||
|
||||
### 步骤 2:端到端的健康检查
|
||||
|
||||
@ -51,7 +51,7 @@
|
||||
|
||||
这倒是挺有用的 – 它告诉我服务器是启动着的!
|
||||
|
||||
但不出所料,我遇到了问题,因为它没有检查 API 是否真的在_工作_ – 有时健康检查成功了,尽管服务的其他部分实际上已经进入了一个糟糕的状态。
|
||||
但不出所料,我遇到了问题,因为它没有检查 API 是否真的在 _工作_ – 有时健康检查成功了,尽管服务的其他部分实际上已经进入了一个糟糕的状态。
|
||||
|
||||
所以我更新了它,让它真正地发出 API 请求,并确保它成功了。
|
||||
|
||||
@ -106,8 +106,6 @@
|
||||
* 一切又正常了
|
||||
* 几个小时后再次重复整个传奇
|
||||
|
||||
|
||||
|
||||
最终,我开始实际修复进程泄漏,但很高兴有一个解决方法可以在我拖延修复 bug 时保持运行。
|
||||
|
||||
这些用于决定是否重新启动服务的运行状况检查更频繁地运行:每 5 分钟左右。
|
||||
@ -129,7 +127,7 @@ via: https://jvns.ca/blog/2022/07/09/monitoring-small-web-services/
|
||||
作者:[Julia Evans][a]
|
||||
选题:[lujun9972][b]
|
||||
译者:[geekpi](https://github.com/geekpi)
|
||||
校对:[校对者ID](https://github.com/校对者ID)
|
||||
校对:[wxy](https://github.com/wxy)
|
||||
|
||||
本文由 [LCTT](https://github.com/LCTT/TranslateProject) 原创编译,[Linux中国](https://linux.cn/) 荣誉推出
|
||||
|
Loading…
Reference in New Issue
Block a user