社会热点

为什么服务器的宕机一般都发生在凌晨使用率最低的时候?

电脑版   2020-11-26 16:08  

为什么服务器的宕机一般都发生在凌晨使用率最低的时候?:来自16年经验老程序员的靠谱回答。主要有以下几个原因1.凌晨时服务器很忙首先,确实服务器的宕机一般都

1

来自16年经验老程序员的靠谱回答。

主要有以下几个原因

1.凌晨时服务器很忙

首先,确实服务器的宕机一般都发生在凌晨使用率最低的时候,但是这个使用率只是针对用户而言的。

实际上,在凌晨的时候,服务器是很忙的。主要忙哪些事情呢?主要是一些定时任务,还有数据库备份等。很多比较耗时的操作比如报表统计都会安排在半夜,以免半天影响正常业务,所以这个时候,服务器都是在高负荷运转的,容易产生事故。

2.一般晚上的时候会上线新功能

同理,发布新代码或者更改功能,也会选择在晚上的业务低峰期。无论前期的测试工作做的多么到位,也难免会隐藏一些bug,到了凌晨,这些bug(比如死循环)已经跑了一段时间了,在无人值守的情况下就可能触发各种故障。

如果上线时间比较短还好,遇到更新比较大的情况下,程序员奋战到大半夜,这个情况下人是很疲惫的,更容易忙中出错。

3.无人值守导致修复变慢

比如死循环和内存泄漏,是需要经过一段时间才能表现出来的。白天有人实时监控,自然出现故障的几率比较小,就算出现故障了,也能很快修复,让用户无法觉察。

4.凌晨是黑客作案高峰期

夜黑风高,杀人越货。这个时间点是正常人休息时间,而黑客则选择在这个时候活动,不论是安全攻击,或者是DDOS,都可能造成服务器故障。

2

计科专业从事嵌入式软件开发多年,最近因为公司需要搞后台研发,经常选择升级的时机放在凌晨,而且大型的数据处理也是放在这个时间段内,经常发生的服务器宕机也是在这个时段。都是在用户使用少的时候开始折腾,折腾的次数多也就容易出现服务器问题。由于做的是物联网设备,在工作中遇到的宕机主要有这么几种情况,对大量数据的操作导致CPU占比在一段时间内骤增从而导致数据接收模块出问题,导致系统监控出现问题,很多设备信息检测不到了。

对数据库的操作太频繁导致效率的下降,也是影响系统性能很重要的一部分,其实服务器也是普通电脑的构成,主要的资源是CPU和内存,这两个因素无论是哪种都有可能导致系统的崩盘,如果是CPU被占满了,系统的反应会变得异常缓慢,时间长了可能还会慢慢缓过劲来,内存如果占满了那么会导致系统的崩溃,直接运行不下去了,其实宕机核心点不会跑出这两种因素。

现在就常见的服务器宕机问题做个归纳总结:

1.磁盘空间被占满,现在程序员运行的时候都习惯于带上log打印,如果时间长了加上没有清理的机制早晚会出问题,这个错误在平时运行过程中经常出现,如果使用的云计算服务器通常在系统崩盘之前都会发个短信,通知你的系统处于崩溃的边缘。

2.并发性能问题,如果多个人同时操作一个数据库或者数据块,会导致系统假死状态,这种属于争抢CPU资源问题,可以通过增加硬件配置以及优化软件代码的效率去解决,数据量如何足够大就可以考虑分布式的管理

3.数据受损或者被破坏导致系统崩盘,所以常见的做法是都会配置备份盘,出现问题抓紧拿到备份盘来顶上,现在公司使用的是阿里云的服务器,稳定性相比之前好太多了,中间换过电信云,腾讯云虽然价格低点,最后受不了直接换成阿里云,再也不想换回去了,数据的稳定性永远是第一位的。

4,一些没有必要的误操作,很多时候是因为程序员或者运维人员的误操作大致服务器大面积的宕机,这种事件在很多云服务提供商身上都发生过,根本层面还是管理问题。后台管理的任何细节都有可能

服务器宕机查找问题的几个线索:

1.看看服务器是不是存在内存泄漏问题,有些时候重启机器开始还能正常运行弄了一段时间之后就会变得非常缓慢,十有八九都是内存的问题

2.是否有黑客入侵造成,有些非常关键重要的数据也是黑客最感兴趣的,一般来讲这种概率不是很高

3.是不是数据库死锁导致的,访问量过大导致,连接数过多造成的。

服务器宕机一旦发生就会引起用户的无数的投诉,无论在什么情况下稳定永远是第一位,现在大的功能升级除非已经百分百验证成功,否则引起的后果不堪设想。

希望能帮到你。

3

虽说在凌晨的时候,使用系统的用户非常少,但是服务器在这个时候要做的工作可能一点儿也没有少:

  • 数据批处理操作通常会集中在凌晨进行:例如很多公司都会在晚上进行对账操作,或为第二天的业务操作做一些预处理;或批量把业务系统的数据抽取到分析系统进行数据分析等等;

  • 很多公司都做不到在线升级和灰度发布,所以系统升级经常安排在半夜,升级完只能做一些简单的验证,测试覆盖度的不足,也可能会导致遗漏一些BUG,最常见的一个问题是忽略了生产环境和测试环境数据量的差距,导致出现性能问题;

  • 服务器操作系统、软件的升级通常也会在晚上进行,这些操作也会带来宕机的风险。

再说一个很久以前看到的,同行们分享的服务器宕机的经历,有些经历非常之神奇,大家就当段子看吧(为了方便,我就按照第一人称来讲述)。

我们服务的甲方是一家医院,机房就在医院的楼中,最近机房的服务器经常性的发生宕机,公司的工程师去了几次也没有发现问题;后来公司被折腾的没办法了,决定让一个工程师晚上住在机房,看看半夜机房中究竟发生了什么事儿,想着就算找不到原因,也能在服务器宕机后第一时间重启。

后来发现原因,到了凌晨三四点的时候,机房门打开了,进来一个值夜班的小护士,看了一眼说:“又没有人,开着空调不浪费电么?”然后就把机房的空调关掉了,然后气温上升...

我将持续分享Java开发、架构设计、程序员职业发展等方面的见解,希望能得到你的关注。

4

这里需要说明一下,服务器宕机是什么意思呢?我们日常说的“宕机”中的“宕”其实指的是英文“down”,宕机表示当前服务器或服务无响应或者不在线状态。

服务器的宕机可分为人为控制的宕机、不可控的宕机。这两者有什么区别呢,下面来具体说明一下:

1、人为可控的宕机行为

服务器长时间的运行可能会带来一些(非致命性)问题,又或者我们需要对服务器进行软/硬件的升级维护时,可能需要停机或者重启操作。这种情况下的宕机是可控的,在我们的计划之内。

2、不可控宕机行为

这种因素就很多了,比如说服务器突然蓝屏、服务异常崩溃、突然断电断网了,这时候服务(器)就无法正常提供服务,这些都是不可控因素导致的。


而在我们的日常运维工作中,计划性的宕机维护一般都选择在半夜来做这些事,为什么呢,原因主要有这几点:

1、减少对用户的影响

凌晨大家基本上都休息了,用户量较白天来说小得多,所以选择在此时进行系统及硬件的维护导致的宕机对用户的影响较小,就算有影响也只是影响小部分用户。

2、有足够的时间来处理故障

在凌晨进行维护,就算有问题,技术人员也有足够的时间(比如说:00~05点)去处理故障。如果换成在日间维护,服务(器)宕机1小时以上投诉单全都过来了,压力很大的。


以上就是我的观点,对于这个问题大家是怎么看待的呢?欢迎在下方评论区交流 ~ 我是科技领域创作者,十年互联网从业经验,欢迎关注我了解更多科技知识!

5

作为一个运维人员,我想声明一下,我认为你说的这个问题没有什么道理... 这件事存在偶然性

之前我们单位夜晚有一台设备down了,这台设备做的堆叠,而不是备份,所有下联线路全部连接在主设备上。结果当晚凌晨,主设备的电源模块损坏了!这... 你能看出规律吗?我也想知道为什么它偏偏凌晨损坏了!

所以说,偶然性事件,不能说大部分!

但是夜间割接倒是正常,选择在用户最少的时候做可能影响业务的必要事情是常识。

6

通俗点

1、一堆定时任务,比如重启一下、备份等等,用过电脑的都知道你开着不动他基本上没事,出问题都是关机之后再次开机就开不起来了,具体原因未知,服务器也是一样,折腾一下就跪了

2、各种折腾,一半白天不敢动啊 动了会被客户打死,都是通宵搞服务器,结果折腾折腾就全奔溃了……

3、白天有人看着,一出问题立马修复或者切换备份一般,一般都不怎么有感觉。 晚上不一样我都睡着啦.你想找到我 等我修复怎么需要时间吧

大概就这三个问题,至于黑不黑客.....黑客攻击一般不分时间,有一种列外就是黑客会定制一些计划任务然后再晚上没人的时间进行执行等等

当然还有的程序员也比较坑,都是在晚上搞事情 各种备份 各种折腾 不把我系统的折腾死不罢休

7

我是雪鹿,是一名科技领域创作者,希望我的回答可以对你有帮助。
为什么服务器的宕机一般都发生在凌晨使用率最低的时候?

我认为有以下几个原因。第一,人为的后台更新关闭了服务。第二,凌晨数据更新,服务器负载加大。第三,遇到突发事件应急反应事件太长。

第一,人为的后台更新关闭了服务。

从事过软件行业的程序员都知道,软件一直是要更新完善的,服务端的软件也需要定时更新。白天大家都在活动,对服务器的使用量大,如果白天使用高峰期停止服务进行更新,那对用户来说体验是很差的。就比如上班高峰期,突然把路封了,你不得炸毛。所以每次更新维护,都会选择凌晨3-4点左右,这个时候大家基本都睡了,熬夜的基本也该睡了,正好是更新的好时候。偶尔还会有在线的,突然断开一会,就会有为啥凌晨服务器老是宕机的感觉。

第二,凌晨数据更新,服务器负载加大。

大家玩游戏,使用APP,发现每天可以签到,游戏的任务每天都更新,有时候是凌晨0点,有时候是早上6点。这个更新的过程,服务器也是要参与的,对服务器来说,这就是一个负荷,有时候难免会出错,也会出现宕机的现象。

第三,遇到突发事件应急反应时间太长。

凌晨大家都休息了,程序员当然大多也休息了,可能某个服务程序出错导致宕机,后台维护人员也不会第一时间发现,发现的时候也是有一个时间差。这个期间,用户是无法使用的,也会有一个宕机很多的错觉。其实白天可能也有,但是一线维护人员会第一时间发现并且处理。

最后总结:服务器宕机在凌晨,可能有人为,也可能是客观因素,但我个人认为不是题主说的是使用率最低的时候,而是因为以上的因素,造成的大家的一个错觉。以上是我对这个问题的解答和观点,纯手打,实属不易,也仅表达个人观点,希望能给读者很好的参考,若是觉得写的还可以就给个赞吧。

8

因为凌晨是最困得时候,服务器一打盹就宕机了。

9

偶发性的,可以能是你浅意识的,因为这种问题印像最深刻,可能认为比较多,通过做记录去试下。

宕机一般分5种情况:

1、程序上出了问题导致程序崩溃。

2、cpuGpu 、内存占满了。

3、硬盘空间满了

4、数据库表空间满了

5、机房温度过高


以上是个人在运维过程中所遇到的问题,做的总结性回答

10

这个吧,别人我不清楚,我们宕机其实白天很多,只是白天会马上解决,而晚上都不知道所以到第二天早上才解决,然后就是阿里云服务器一般有迁移动作都是晚上,因为用户少,影响小,这样也会导致客户的服务器多数在晚上宕机

本文版权归原作者所有,如需商业用途或转载请与原作者联系。

分享

相关信息
 
李靓蕾会原谅王力宏吗

2021-12-30 14:01:01