美文网首页
ssk字幕组主站一次故障的排除

ssk字幕组主站一次故障的排除

作者: 有时右逝 | 来源:发表于2018-05-04 20:24 被阅读0次

前言

业余之外,个人负责一个网站的技术支持:ssk字幕组
该站点近期出现故障,记录一下该故障的解决过程。

问题

五一假期的早上,字幕组的校对找我。

image.png

我尝试访问了下网站,果然挂了。

解决

  • 先确保服务是否异常。该网站是基于apache+php+mysql 开发的。
    依次检查服务是否正常工作。
ps -aux | grep 80
ps -aux | grep 3306

我执行之后发现3306异常。mysql服务挂了。

  • 查询mysql服务故障日志。
    mysql的错误日志在哪里?这是个难点。
    • 首先去寻找mysql的配置文件。查看配置文件是否记录。
      mysql的配置文件名字是my.cnf
find / -name my.cnf    常用的查询文件
locate my.cnf   速度快。我推荐这个。

执行之后,会出现文件列表。

[root@iZ226c7td97Z ~]# locate my.cnf
/etc/my.cnf
/etc/my.cnf.old
/root/conf/com_my.cnf
/root/conf/innodb_my.cnf
/root/conf/my.cnf
/root/conf/vps_my.cnf
....

mysql的配置文件生效规则是

1、mysql启动时直接指定的具体参数
2、mysql 启动时直接指定位置的配置文件,优先级次
3、mysql 数据目录下的my.cnf 文件
4、mysql 读取 /etc/my.cnf
5、mysql 默认的参数

这里我依次查看了配置文件。没有找到错误日志的文件位置。

  • 登录mysql。去查询配置。
root@iZ226c7td97Z ~]# mysql -uroot -p
Enter password:
Welcome to the MySQL monitor.  Commands end with ; or \g.
Your MySQL connection id is 20549
Server version: 5.5.27 Source distribution

Copyright (c) 2000, 2011, Oracle and/or its affiliates. All rights reserved.

Oracle is a registered trademark of Oracle Corporation and/or its
affiliates. Other names may be trademarks of their respective
owners.

Type 'help;' or '\h' for help. Type '\c' to clear the current input statement.

mysql> show variables like 'log_%';
+---------------------------------+-----------------------------------------+
| Variable_name                   | Value                                   |
+---------------------------------+-----------------------------------------+
| log_bin                         | OFF                                     |
| log_bin_trust_function_creators | OFF                                     |
| log_error                       | /www/sites/mysql/var/iZ226c7td97Z.err |
| log_output                      | FILE                                    |
| log_queries_not_using_indexes   | OFF                                     |
| log_slave_updates               | OFF                                     |
| log_slow_queries                | OFF                                     |
| log_warnings                    | 1                                       |
+---------------------------------+-----------------------------------------+
8 rows in set (0.00 sec)

mysql>

其中log_error就是日志位置。

  • 浏览错误日志,寻找出错的原因。

浏览的时候,发现70408 23:40:15 InnoDB: Fatal error: cannot allocate memory for the buffer pool

说明是分配内存失败,导致异常。
使用下面的命令可以查看系统内容。

[root@iZ226c7td97Z ~]# free -m
             total       used       free     shared    buffers     cached
Mem:           996        822        173          0        122        293
-/+ buffers/cache:        406        589
Swap:            0          0          0

服务器配置很低,内存不太足。

问题已经找到了。这里可以解决的方法那就是升级内存配置即可。
这里选择暂时不升级。直接重启mysql服务即可。

/etc/init.d/mysqld start

其他问题

在解决这个问题的过程中,遇到一个问题,忘记了root用户密码。
于是需要找回下root密码。这个问题费时较久。遇到一些坑。记录一下。
该站点的服务器使用了wdcp进行管理。而wdcp提供了找回密码的工具。
路径是 /www/sites/wdlinux/tools下。

[root@iZ226c7td97Z wdlinux]# cd tools/
[root@iZ226c7td97Z tools]# ls
httpd_restart.sh  mysql_root_chg.sh  mysql_wdcp_chg.sh  pureftp_conf_check.sh  wdcp_cdip.sh  wdcp_disk_xvdb.sh  wdcp_env.sh  wdcp_login_cbip.sh  wdcp_login_chp.sh  wdcp_ntp.sh  wdcp_perm_check.sh  web_logs.sh

其中mysql_root_chg.sh 就是找回root密码。

这个工具在我这里无法正常工作。这里我的wdcp版本wdcp_v2.5.15(20150826)

[root@iZ226c7td97Z tools]# ./mysql_root_chg.sh

Running..., Please Wait...
ERROR 2002 (HY000): Can't connect to local MySQL server through socket '/tmp/mysql.sock' (2)
Change root password is OK
Current root password is:DlprEUad

于是我这里选择另外一个方法找回密码。

找回mysql的root密码通用方案。

  • 先停止mysql服务。
ps -aux | grep 3306
ps -aux | grep mysql
kill -9 pid
  • 以不检查权限的方式启动mysql
/www/sites/wdlinux/mysql/bin/mysqld_safe  -skip-grant-tables &
  • 此时登录root不需要密码.
    mysql -u root 
    MySQL> update mysql.user set password=PASSWORD('新密码') where User='root';  
    MySQL> flush privileges;  
    MySQL> quit 
  • 停止mysql服务。以正常模式启动。即可了。

意外情况

原本整个过程很流畅。我遇到一个异常情况:
重置后的root密码无法登陆普通模式下的mysql。
经过检查,发现正常启动的mysql服务和跳过权限的mysql服务数据不一致。
我猜测是datadir不同导致的.查看配置文件/etc/my.cnf 没有配置该参数。

于是这里我先使用普通账号登录数据库。找到datadir的配置。

show variables like 'data%';
+---------------+-------------------------+
| Variable_name | Value                   |
+---------------+-------------------------+
| datadir       | /www/sites/wdlinux/mysql/var/ |
+---------------+-------------------------+
1 row in set (0.00 sec)

然后将该配置写入/etc/my.cnf

mysqld]
port        = 3306
socket      = /tmp/mysql.sock
datadir=/www/sites/wdlinux/mysql/var

再次按上面的步骤操作。结果成功。

最后

获得认可还是很开心的。

image.png

相关文章

网友评论

      本文标题:ssk字幕组主站一次故障的排除

      本文链接:https://www.haomeiwen.com/subject/wphjrftx.html