昨天(2023年7月19日)全天网站服务器都是崩溃的状态,一直到晚上我才发现,重启后解决了,在这里给大家谢罪……
服务器的内部监控全天没有记录到任何内容,查看阿里云外部监控的数据可以看到,全天的CPU占用都在98%以上,IO全天保持超过2000次/秒,内存占用也持续在75%以上(平时都是40%)。重启服务器后恢复正常,但是没有找出原因,以前也发生过类似的情况。现在最要紧的就是找出到底哪个程序在疯狂读取磁盘(IO全是读,没有写)。服务器内部监控这时候基本没用,我还是去阿里云云监控加了一个告警规则(如图)
这个问题又出现了(ó﹏ò。),这两天加了日志追踪,希望能解决吧……
我也遇到过,到后台看网络占用还几乎没有,搞得像CC一样,问群里的都说是CC,一天三四次,想着当时服务器还有重要的东西,地域还不能备份,也是只重启,现在竟然没有了,特别离谱😅
是的是的,好离谱 ̄﹃ ̄这两天竟然没有了