美文网首页
ssk字幕组主站一次故障的排除

ssk字幕组主站一次故障的排除

作者: 有时右逝 | 来源:发表于2018-05-04 20:24 被阅读0次

    前言

    业余之外,个人负责一个网站的技术支持:ssk字幕组
    该站点近期出现故障,记录一下该故障的解决过程。

    问题

    五一假期的早上,字幕组的校对找我。

    image.png

    我尝试访问了下网站,果然挂了。

    解决

    • 先确保服务是否异常。该网站是基于apache+php+mysql 开发的。
      依次检查服务是否正常工作。
    ps -aux | grep 80
    
    ps -aux | grep 3306
    

    我执行之后发现3306异常。mysql服务挂了。

    • 查询mysql服务故障日志。
      mysql的错误日志在哪里?这是个难点。
      • 首先去寻找mysql的配置文件。查看配置文件是否记录。
        mysql的配置文件名字是my.cnf
    find / -name my.cnf    常用的查询文件
    locate my.cnf   速度快。我推荐这个。
    

    执行之后,会出现文件列表。

    [root@iZ226c7td97Z ~]# locate my.cnf
    /etc/my.cnf
    /etc/my.cnf.old
    /root/conf/com_my.cnf
    /root/conf/innodb_my.cnf
    /root/conf/my.cnf
    /root/conf/vps_my.cnf
    ....
    

    mysql的配置文件生效规则是

    1、mysql启动时直接指定的具体参数
    2、mysql 启动时直接指定位置的配置文件,优先级次
    3、mysql 数据目录下的my.cnf 文件
    4、mysql 读取 /etc/my.cnf
    5、mysql 默认的参数

    这里我依次查看了配置文件。没有找到错误日志的文件位置。

    • 登录mysql。去查询配置。
    root@iZ226c7td97Z ~]# mysql -uroot -p
    Enter password:
    Welcome to the MySQL monitor.  Commands end with ; or \g.
    Your MySQL connection id is 20549
    Server version: 5.5.27 Source distribution
    
    Copyright (c) 2000, 2011, Oracle and/or its affiliates. All rights reserved.
    
    Oracle is a registered trademark of Oracle Corporation and/or its
    affiliates. Other names may be trademarks of their respective
    owners.
    
    Type 'help;' or '\h' for help. Type '\c' to clear the current input statement.
    
    mysql> show variables like 'log_%';
    +---------------------------------+-----------------------------------------+
    | Variable_name                   | Value                                   |
    +---------------------------------+-----------------------------------------+
    | log_bin                         | OFF                                     |
    | log_bin_trust_function_creators | OFF                                     |
    | log_error                       | /www/sites/mysql/var/iZ226c7td97Z.err |
    | log_output                      | FILE                                    |
    | log_queries_not_using_indexes   | OFF                                     |
    | log_slave_updates               | OFF                                     |
    | log_slow_queries                | OFF                                     |
    | log_warnings                    | 1                                       |
    +---------------------------------+-----------------------------------------+
    8 rows in set (0.00 sec)
    
    mysql>
    

    其中log_error就是日志位置。

    • 浏览错误日志,寻找出错的原因。

    浏览的时候,发现70408 23:40:15 InnoDB: Fatal error: cannot allocate memory for the buffer pool

    说明是分配内存失败,导致异常。
    使用下面的命令可以查看系统内容。

    [root@iZ226c7td97Z ~]# free -m
                 total       used       free     shared    buffers     cached
    Mem:           996        822        173          0        122        293
    -/+ buffers/cache:        406        589
    Swap:            0          0          0
    

    服务器配置很低,内存不太足。

    问题已经找到了。这里可以解决的方法那就是升级内存配置即可。
    这里选择暂时不升级。直接重启mysql服务即可。

    /etc/init.d/mysqld start
    

    其他问题

    在解决这个问题的过程中,遇到一个问题,忘记了root用户密码。
    于是需要找回下root密码。这个问题费时较久。遇到一些坑。记录一下。
    该站点的服务器使用了wdcp进行管理。而wdcp提供了找回密码的工具。
    路径是 /www/sites/wdlinux/tools下。

    [root@iZ226c7td97Z wdlinux]# cd tools/
    [root@iZ226c7td97Z tools]# ls
    httpd_restart.sh  mysql_root_chg.sh  mysql_wdcp_chg.sh  pureftp_conf_check.sh  wdcp_cdip.sh  wdcp_disk_xvdb.sh  wdcp_env.sh  wdcp_login_cbip.sh  wdcp_login_chp.sh  wdcp_ntp.sh  wdcp_perm_check.sh  web_logs.sh
    

    其中mysql_root_chg.sh 就是找回root密码。

    这个工具在我这里无法正常工作。这里我的wdcp版本wdcp_v2.5.15(20150826)

    [root@iZ226c7td97Z tools]# ./mysql_root_chg.sh
    
    Running..., Please Wait...
    ERROR 2002 (HY000): Can't connect to local MySQL server through socket '/tmp/mysql.sock' (2)
    Change root password is OK
    Current root password is:DlprEUad
    

    于是我这里选择另外一个方法找回密码。

    找回mysql的root密码通用方案。

    • 先停止mysql服务。
    ps -aux | grep 3306
    ps -aux | grep mysql
    kill -9 pid
    
    • 以不检查权限的方式启动mysql
    /www/sites/wdlinux/mysql/bin/mysqld_safe  -skip-grant-tables &
    
    • 此时登录root不需要密码.
        mysql -u root 
        MySQL> update mysql.user set password=PASSWORD('新密码') where User='root';  
        MySQL> flush privileges;  
        MySQL> quit 
    
    • 停止mysql服务。以正常模式启动。即可了。

    意外情况

    原本整个过程很流畅。我遇到一个异常情况:
    重置后的root密码无法登陆普通模式下的mysql。
    经过检查,发现正常启动的mysql服务和跳过权限的mysql服务数据不一致。
    我猜测是datadir不同导致的.查看配置文件/etc/my.cnf 没有配置该参数。

    于是这里我先使用普通账号登录数据库。找到datadir的配置。

    show variables like 'data%';
    +---------------+-------------------------+
    | Variable_name | Value                   |
    +---------------+-------------------------+
    | datadir       | /www/sites/wdlinux/mysql/var/ |
    +---------------+-------------------------+
    1 row in set (0.00 sec)
    

    然后将该配置写入/etc/my.cnf

    mysqld]
    port        = 3306
    socket      = /tmp/mysql.sock
    datadir=/www/sites/wdlinux/mysql/var
    

    再次按上面的步骤操作。结果成功。

    最后

    获得认可还是很开心的。

    image.png

    相关文章

      网友评论

          本文标题:ssk字幕组主站一次故障的排除

          本文链接:https://www.haomeiwen.com/subject/wphjrftx.html