美文网首页Django学习python基础django
爬取简书全站文章并生成 API(五)

爬取简书全站文章并生成 API(五)

作者: 田飞雨 | 来源:发表于2016-08-03 11:41 被阅读3300次
简书

看完前面的四篇文章,就已经可以爬取简书全站的文章做成 API,并且可以部署上线了。但是我对 Docker 这个很火的东西非常感兴趣,前段时间学了 Docker 的基本操作,正好可以用上。这也时我第一次用 Docker 部署 Django 应用,若有不正确的地方,还望指出。

使用 Docker 部署 Django 应用程序

由于 Docker Hub 的镜像在国内下载速度非常慢,所以此次使用的都是 daocloud 提供的镜像。Docker 的基本操作可以参考 http://www.tianfeiyu.com/?cat=159.

Docker 部署 Django 应用可以通过两种方式来完成:迭代构建和容器互联。以下使用容器互联的方式搭建 Django 容器栈。

注意:以下所有操作步骤均在 CentOS 6.6 x86_64 下完成。

所需镜像

  • Docker version 1.7.1
  • daocloud.io/nginx:1.11
  • daocloud.io/python:2.7
  • daocloud.io/mysql:5.6
  • daocloud.io/django:1.9

容器创建的顺序:

mysql --> redis --> django --> nginx
架构图

构建镜像前请先下载好所有所需的镜像。

1. 创建 mysql 容器

首先创建一个用于构建容器的目录:

# mkdir /docker
# cd /docker/

然后创建好以下几个目录用于存放相应的文件:

├── mysql  
│   ├── conf.d    
│   │   ├── jianshu.sql       ---对应的 django 数据库文件,需要手动导入
│   │   ├── character.cnf  ---设定字符集
│   │   └── my.cnf         ---额外配置
│   ├── data               ---挂载数据库文件的目录
│   └── start.sh           ---容器启动脚本

以下是 mysql 容器的启动脚本:

#!/bin/bash 
#

echo "---------------start mysql image-------------------"
docker run --name mysql \
-v $(pwd)/conf.d:/etc/mysql/conf.d \
-v $(pwd)/data:/var/lib/mysql \
-e MYSQL_ROOT_PASSWORD=123456 \
-p 3307:3306 \
-d daocloud.io/mysql:5.6.30 

上述脚本创建一个名为 mysql 的容器,挂载容器的配置文件目录与数据目录并且初始化 mysql 的密码。

2. 创建 redis 容器

使用 redis 缓存后端数据。

redis 容器不需要特别的处理。

├── redis
│   └── start.sh

启动脚本:

#!/bin/bash 
#

docker run --name redis -d daocloud.io/redis:3.0.7

3. 创建 django 容器

要创建 django 容器,首先需要一个 django 镜像,即在 daocloud.io/python:2.7 镜像中安装 django 所需的环境。再将 django 容器与 mysqlredis 容器进行互联。

└── web
    ├── jianshu.tar.gz       ---app 打包文件
    ├── Dockerfile          ---构建 django 镜像所使用的 Dockerfile
    ├── requirements.txt  ---app 依赖的库
    ├── start.sh          ---启动脚本
    └── stop.sh              

以下为 Dockerfile 文件信息:

# 基础镜像
FROM daocloud.io/python:2.7

# 维护者信息
MAINTAINER tianfeiyu <www.tianfeiyu.com>

ADD blog.tar.gz /usr/src/ 

# app 所在目录
WORKDIR /usr/src/jianshu

# 安装 app 所需依赖
RUN pip install --no-cache-dir -r requirements.txt -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com

启动脚本:

#!/bin/bash 
# 
docker exec -d mysql mysql -uroot -p123456 -e "create database blog;"
docker build -t feiyu/django-app .
docker run --name django \
-v /usr/src/jianshu \
-v /usr/src/jianshu/static \                                                                                         
--link mysql:mysql \
--link redis:redis \
-p 12000:8000 \
-d feiyu/django-app /usr/local/bin/uwsgi --http :8000 --chdir /usr/src/jianshu -w jianshu.wsgi

上面使用 --link 选项来能够进行容器间安全的交互通信,使用格式 name:alias,可在一个 docker run 命令中重复使用该参数,使用 --link 时,连接通过容器名来确定容器,建议启动容器时自定义容器名。

通过 --link 选项来建立容器间连接,不但可以避免容器的 IP 和端口暴露到外网所导致的安全问题,还可以防止容器在重启后 IP 地址变化导致的访问失效,它的原理类似于 DNS 服务器的域名和地址映射。当容器的 IP 地址发生变化时,Docker 将自动维护映射关系中 IP 地址。

Docker 通过 2 种方式为容器公开连接信息:环境变量和更新 /etc/hosts 文件。

依旧使用 uwsgi来启动 django 应用程序,也可以使用 gunicorn 来启动。

4. 创建 nginx 容器

nginx 容器的创建比较简单,先在构建镜像时将 nginx 的配置文件复制到镜像,再将 nginx 容器与 django 容器进行互联并且挂载 django 容器中的数据卷。

├── nginx
│   ├── Dockerfile                 ---构建 nginx 镜像的 Dockerfile
│   ├── nginx-conf                    
│   │   └── django_project.conf       ---提供的 nginx 配置文件 
│   ├── restart.sh
│   ├── start.sh
│   └── stop.sh

Dockerfile 文件:

FROM daocloud.io/nginx
 
MAINTAINER tianfeiyu <www.tianfeiyu.com>                                                                            
 
RUN rm /etc/nginx/conf.d/default.conf
ADD nginx-conf/ /etc/nginx/conf.d/

启动脚本:

#!/bin/bash 
#                                                                                                                   
docker build -t nginx .        
docker run --name nginx-server \
--link django:web \            
-v /www/static \               
--volumes-from django \        
-p 8888:80 \
-d nginx

到此,所有容器的创建过程都已经了解清楚,所有文件的目录树如下所示:

目录树

5. 启动容器栈

为了方便测试,每个需要创建的容器下面都会有一个启动脚本,并且有一个控制所有容器的启动脚本与停止脚本:

#!/bin/bash
#
cd mysql                                                                                                            
echo "start mysql----------------"
./start.sh
 
cd ../redis  
echo "start redis---------------------"
./start.sh
 
cd ../web 
echo "start web ---------------------"
./start.sh
 
cd ../nginx
echo "start nginx-------------------"
./start.sh
启动完成

然后进入到 mysql 容器中将 django 数据库文件导入:

# docker inspect --format "{{.State.Pid}}" mysql
12674
# nsenter --target 12674 --mount --uts --ipc --net --pid
root@91308514f209:/# cd /etc/mysql/conf.d/
root@91308514f209:/etc/mysql/conf.d# mysql -uroot -p jianshu < jianshu.sql

完整的代码请查看 github 项目地址

相关文章

网友评论

  • 星丶雲:#!/bin/bash
    #
    dockedocker build -t feiyu/django-app .
    docker run --name django \
    -v /usr/src/jianshu \
    -v /usr/src/jianshu/static \
    --link mysql:mysql \
    --link redis:redis \
    -p 12000:8000 \
    -d feiyu/django-app /usr/local/bin/uwsgi --http :8000 --chdir /usr/src/jianshu -w jianshu.wsgi

    这里面的dockedocker build -t feiyu/django-app .
    docker run --name django \ 是什么意思啊
  • 星丶雲:这个属于一个镜像 包含多个容器是吧
  • 星丶雲:项目不打包 可以吗
  • 星丶雲:在吗 问几个问题
  • 天悬山河:楼主,我照着你的项目搭出来了,也自己试着搭了一下,但是都有一个问题就是好像是js和CSS加载不出来?浏览器报的错误是404,找不到static文件夹里的文件,虽然./start.sh 里有一句是-v /usr/src/myblog/static 好像没起作用,不知道楼主遇到过这种错误过么?
    田飞雨: @天悬山河 请看第四章
  • d335426eafe5:好东西
  • Ryan文濤:完全看不懂怎么破:fearful::fearful:
    田飞雨:@Ryan文濤 我觉得应该是python好用,后端语言应该都可以爬虫,像php,c++,java都可以,但我只会python
    Ryan文濤:@田飞雨 这些都是python写的吗?爬虫是不是python好用一些~
    田飞雨:@Ryan文濤 可以先看那个 Docker 的基本操作
  • b81baddace77:准备试一下
    b81baddace77: @田飞雨 OK,多谢!
    田飞雨:@lianhs 嗯,有问题直接问我
  • Mycro:66666
  • 就是小龙虾:前排膜拜

本文标题:爬取简书全站文章并生成 API(五)

本文链接:https://www.haomeiwen.com/subject/zuuqsttx.html