美文网首页
一次诡异的docker错误调试

一次诡异的docker错误调试

作者: ZeroWind | 来源:发表于2019-04-07 00:41 被阅读0次

    源自小伙伴的求助,虽然没能定位到最终的原因,调试的过程也比较有意思

    缘起

    小伙伴求助我,同一个docker镜像在测试机器上可以运行,在阿里云上运行提示用户不存在。

    在阿里云上运行提示如下:

    # docker run --rm -it image:tag
    docker: Error response from daemon: linux spec user: unable to find user www-data: no matching entries in passwd file.
    ERRO[0000] error waiting for container: context canceled
    
    • 镜像名称统一使用image:tag代替,其实错误和镜像的关系不大
    • 从错误描述看:应该是在/etc/passwd中未能找到www-data这个用户,判断用户不存在

    调试过程

    换成用root启动,依然提示找不到用户

    # docker run --rm -it --user root image:tag
    docker: Error response from daemon: linux spec user: unable to find user root: no matching entries in passwd file.
    
    • 看来root也要在/etc/passwd里面找

    换一种方式启动,错误提示变了

    # docker run --rm -it --user $(id -u) image:tag
    docker: Error response from daemon: OCI runtime create failed: container_linux.go:348: starting container process caused "exec: \"docker-php-entrypoint\": executable file not found in $PATH": unknown.
    
    • 看来镜像设置有entrypoint
    • 但是为什么找不到entrypoint

    换一个entrypoint试试看

    # docker run --rm -it --user $(id -u) --entrypoint 'ls' image:tag
    docker: Error response from daemon: OCI runtime create failed: container_linux.go:348: starting container process caused "exec: \"ls\": executable file not found in $PATH": unknown.
    
    • ls也找不到?那用/bin/ls试试看

    # docker run --rm -it --user $(id -u) --entrypoint '/bin/ls' image:tag
    docker: Error response from daemon: OCI runtime create failed: container_linux.go:348: starting container process caused "exec: \"/bin/ls\": stat /bin/ls: no such file or directory": unknown.
    
    • 这次错误提示换了,找不到/bin/ls
    • 怀疑是文件系统错误,整个/下的文件都找不到

    /bin/ls挂载到容器内试试

    # docker run --rm -it --user $(id -u) -v '/bin/ls':'/bin/ls' --entrypoint '/bin/ls' image:tag
    standard_init_linux.go:190: exec user process caused "no such file or directory"
    
    • 基本可以确定是docker内文件系统挂了

    山穷水尽

    暂时没找到办法进一步的追踪。通过docker inspectdocker history均看不出镜像的异常。

    通过docker logs也看不到容器启动中的其他错误。

    柳暗花明

    别的小伙伴帮忙找到了这个issue: Error response from daemon: OCI runtime create failed - when running a Node.js Docker image

    虽然错误类型不太一致,发现我一直忘记查看docker daemon的日志!!!!

    通过journalctl -fu docker.service查看错误日志,发现和issue中的错误一致。

    ... level=error msg="stream copy error: reading from a closed fifo"
    

    可能是docker的一个未修复的BUG。

    TODO

    为何--user root时会查找passwd文件,--user $(id -u)可以跳过passwd文件

    相关文章

      网友评论

          本文标题:一次诡异的docker错误调试

          本文链接:https://www.haomeiwen.com/subject/vmcjiqtx.html