CNN+BLSTM+CTC的验证码识别从训练到部署

作者: _Coriander | 来源:发表于2018-12-04 17:31 被阅读10063次

CNN+BLSTM+CTC的验证码识别从训练到部署
linux部署JAVA应用验证码生成失败
万物皆可 Serverless 之使用云函数 SCF 快速部署验
批量去除BOM脚本PHP版
Centos7+Tomcat8验证码不显示问题
解决Could not initilize Class sun.
高音
Selenium模拟登录魅族
Linux下Session无法保存
2018-06-11 rap的部署过程中遇到的坑呀-苦了我

项目地址：https://github.com/kerlomz/captcha_trainer

1. 前言

本项目适用于Python3.6，GPU>=NVIDIA GTX1050Ti，原master分支已经正式切换为CNN+LSTM+CTC的版本了，是时候写一篇新的文章了。

长话短说，开门见山，网络上现有的代码以教学研究为主，本项目是为实用主义者定制的，只要基本的环境安装常识，便可很好的训练出期望的模型，重定义几个简单的参数任何人都能使用机器学习技术训练一个商业化成品。

笔者选用的时下最为流行的CNN+BLSTM+CTC进行端到端的不定长验证码识别，代码中预留了DenseNet+BLSTM+CTC的选项，可以在配置中直接选用。首先，介绍个大概吧。

网格结构	predict-CPU	predict-GPU	模型大小
CNN5+Bi-LSTM+H64+CTC	15ms	28ms	2mb
CNN5+Bi-LSTM+H16+CTC	8ms	28ms	1.5mb
DenseNet+Bi-LSTM+H64+CTC	60ms	60ms	6.5mb

H16/H64指的是Bi-LSTM的隐藏神经元个数num_units，这里注意，你没有看错，也没有写反，LSTM有时序依赖，tf.contrib.rnn.LSTMCell的实现没能很充分的利用GPU的计算资源，底层kernel函数之间的间隙非常大，不利于充分的利用 GPU 的并行性来进行计算。所以本项目使用GPU训练，使用CPU进行预测。预测服务部署项目源码请移步此处：https://github.com/kerlomz/captcha_platform

2.环境依赖：

关于CUDA和cuDNN版本的问题，不少人很纠结，这里就列出官方通过pip安装的TensorFlow的版本对应表：

Linux

Version	Python version	Compiler	Build tools	cuDNN	CUDA
tensorflow_gpu-1.12.0	2.7, 3.3-3.6	GCC 4.8	Bazel 0.15.0	7	9
tensorflow_gpu-1.11.0	2.7, 3.3-3.6	GCC 4.8	Bazel 0.15.0	7	9
tensorflow_gpu-1.10.0	2.7, 3.3-3.6	GCC 4.8	Bazel 0.15.0	7	9
tensorflow_gpu-1.9.0	2.7, 3.3-3.6	GCC 4.8	Bazel 0.11.0	7	9
tensorflow_gpu-1.8.0	2.7, 3.3-3.6	GCC 4.8	Bazel 0.10.0	7	9
tensorflow_gpu-1.7.0	2.7, 3.3-3.6	GCC 4.8	Bazel 0.9.0	7	9
tensorflow_gpu-1.6.0	2.7, 3.3-3.6	GCC 4.8	Bazel 0.9.0	7	9

Windows

Version	Python version	Compiler	Build tools	cuDNN	CUDA
tensorflow_gpu-1.12.0	3.5-3.6	MSVC 2015 update 3	Bazel 0.15.0	7	9
tensorflow_gpu-1.11.0	3.5-3.6	MSVC 2015 update 3	Bazel 0.15.0	7	9
tensorflow_gpu-1.10.0	3.5-3.6	MSVC 2015 update 3	Cmake v3.6.3	7	9
tensorflow_gpu-1.9.0	3.5-3.6	MSVC 2015 update 3	Cmake v3.6.3	7	9
tensorflow_gpu-1.8.0	3.5-3.6	MSVC 2015 update 3	Cmake v3.6.3	7	9
tensorflow_gpu-1.7.0	3.5-3.6	MSVC 2015 update 3	Cmake v3.6.3	7	9
tensorflow_gpu-1.6.0	3.5-3.6	MSVC 2015 update 3	Cmake v3.6.3	7	9

如果希望使用上面对应之外的搭配的CUDA和cuDNN，可以自行编译TensorFlow，或者去Github上搜索TensorFlow Wheel找到第三方编译的对应版本的whl安装包。提前预警，若是自己编译将会苦难重重，坑很多，这里就不展开了。

2.1 本项目环境依赖

目前在以下主流操作系统平台均测试通过：

操作系统	最低支持版本
Ubuntu	16.04
Windows	7 SP1
MacOS	N/A

本训练项目主要的环境依赖清单如下

依赖	最低支持版本
Python	3.6
TensorFlow-GPU	1.6.0
Opencv-Python	3.3.0.10
Numpy	1.14.1
Pillow	4.3.0
PyYaml	3.13

2.1.1 Ubuntu 16.04 下的 Python 3.6

1）先安装Python环境

sudo apt-get install openssl  
sudo apt-get install libssl-dev
sudo apt-get install libc6-dev gcc  
sudo apt-get install -y make build-essential zlib1g-dev libbz2-dev libreadline-dev $ libsqlite3-dev wget curl llvm tk-dev 
wget https://www.python.org/ftp/python/3.6.6/Python-3.6.6.tgz
tar -vxf Python-3.6.6.tar.xz
cd Python-3.6.6
./configure --prefix=/usr/local  --enable-shared
make -j8
sudo make install -j8

经过上面指令就安装好Python3.6环境了，如果提示找不到libpython3.6m.so.1.0就到/usr/local/lib路径下将该文件复制一份到/usr/lib和/usr/lib64路径下。
2）安装相关依赖（这一步Windows和Linux通用）
可以直接在项目路径下执行pip3 install -r requirements.txt安装所有依赖，注意这一步是安装在全局Python环境下的，强烈建议使用虚拟环境进行项目间的环境隔离，如Virtualenv或Anaconda等等。
我一般使用的是Virtualenv，有修改代码需要的，建议安装PyCharm作为Python IDE

virtualenv -p /usr/bin/python3 venv # venv is the name of the virtual environment.
cd venv/ # venv is the name of the virtual environment.
source bin/activate # to activate the current virtual environment.
cd captcha_trainer # captcha_trainer is the project path.
pip3 install -r requirements.txt

2.1.2 Ubuntu 16.04 下的 CUDA/cuDNN

网上看到过很多教程，我自己也部署过很多次，Ubuntu 16.04遇到的坑还是比较少的。14.04支持就没那么好，如果主板不支持关闭SecureBoot的话千万不要安装Desktop版，因为安装好之后一定会无限循环在登陆界面无法进入桌面。
网上教程说要加驱动黑名单什么的我直接跳过了，亲测没那个必要。就简单的几步：
1. 下载好安装包
注意下载runfile类型的安装包，deb安装会自动安装默认驱动，极有可能导致登陆循环
NVIDIA 驱动下载：https://www.geforce.cn/drivers
CUDA 下载地址：https://developer.nvidia.com/cuda-downloads
cuDNN 下载地址：https://developer.nvidia.com/cudnn （需要注册NVIDIA账号且登陆，下载deb安装包）

2. 关闭图形界面
Ctrl+alt+F1进入字符界面，关闭图形界面

sudo service lightdm stop

3. 安装Nvidia Driver

命令中的版本自己对应下载的版本改，在上面的下载地址根据自己的显卡型号下载最新版，切记是runfile格式的安装包。

sudo chmod a+x NVIDIA-Linux-x86_64-384.90.run //获取执行权限
sudo ./NVIDIA-Linux-x86_64-384.90.run –no-x-check –no-nouveau-check –no-opengl-files //安装驱动

安装成功以后使用以下命令验证，如果显示显卡信息则表示安装成功

nvidia-smi

4. 安装CUDA

1）先安装一些系统依赖库

sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev

执行安装程序，按指示无脑继续就好了，如果提示是否安装驱动选不安装。

sudo sh cuda_9.0.176_384.81_linux.run

安装完如果环境变量没配上去，就写到 ~/.bashrc 文件的尾部

export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

然后在终端执行 sudo ldconfig更新，安装完毕就可以重启机器重启图形界面了。

sudo service lightdm start

2.1.3 Windows 系统

在Windows其实简单很多，只要到官网下载安装包无脑安装就可以了，下载连接同Ubuntu，先安装Python，显卡驱动，CUDA，然后下载对应的cuDNN替换到对应路径即可。

花了超长篇幅介绍了训练环境的基本搭建，主要是给尚未入门的读者看的，老鸟们随便跳过

3 使用

入手的第一步环境搭建好了，那就是准备跑代码了，还是有几个必要的条件，巧妇难为无米之炊，首先，既然是训练，要先有训练集，笔者不满百度云不开会员龟速10kb限速很久了，所以上传到QQ群857149419共享里，有一个新手尝鲜的训练集，是mnist手写识别的例子，现在万事俱备，只欠东风。

3.1 定义一个模型

本项目采用的是参数化配置，不需要改动任何代码，可以训练几乎任何字符型图片验证码，下面从两个配置文件说起：
config.yaml # 系统配置

# - requirement.txt  -  GPU: tensorflow-gpu, CPU: tensorflow
# - If you use the GPU version, you need to install some additional applications.
# TrainRegex and TestRegex: Default matching apple_20181010121212.jpg file.
# - The Default is .*?(?=_.*\.)
# TrainsPath and TestPath: The local absolute path of your training and testing set.
# TestSetNum: This is an optional parameter that is used when you want to extract some of the test set
# - from the training set when you are not preparing the test set separately.
System:
  DeviceUsage: 0.7
  TrainsPath: 'E:\Task\Trains\YourModelName\'
  TrainRegex: '.*?(?=_)'
  TestPath: 'E:\Task\TestGroup\YourModelName\'
  TestRegex: '.*?(?=_)'
  TestSetNum: 1000

# CNNNetwork: [CNN5, DenseNet]
# RecurrentNetwork: [BLSTM, LSTM]
# - The recommended configuration is CNN5+BLSTM / DenseNet+BLSTM
# HiddenNum: [64, 128, 256]
# - This parameter indicates the number of nodes used to remember and store past states.
NeuralNet:
  CNNNetwork: CNN5
  RecurrentNetwork: BLSTM
  HiddenNum: 64
  KeepProb: 0.98

# SavedSteps: A Session.run() execution is called a Steps,
# - Used to save training progress, Default value is 100.
# ValidationSteps: Used to calculate accuracy, Default value is 100.
# TestNum: The number of samples for each test batch.
# - A test for every saved steps.
# EndAcc: Finish the training when the accuracy reaches [EndAcc*100]%.
# EndEpochs: Finish the training when the epoch is greater than the defined epoch.
Trains:
  SavedSteps: 100
  ValidationSteps: 500
  EndAcc: 0.975
  EndEpochs: 1
  BatchSize: 64
  TestBatchSize: 400
  LearningRate: 0.01
  DecayRate: 0.98
  DecaySteps: 10000

上面看起来好多好多参数，其实大部分可以不用改动，你需要修改的仅仅是训练集路径就可以了，注意：如果训练集的命名格式和我提供的新手训练集不一样，请根据实际情况修改TrainRegex和TestRegex的正则表达式。，TrainsPath和TestPath路径支持list参数，允许多个路径，这种操作适用于需要将多种样本训练为一个模型，或者希望训练一套通用模型的人。为了加快训练速度，提高训练集读取效率，特别提供了make_dataset.py来支持将训练集打包为tfrecords格式输入，经过make_dataset.py打包之后的训练集将输出到本项目的dataset路径下，只需修改TrainsPath键的配置如下即可

TrainsPath: './dataset/xxx.tfrecords'

TestPath是允许为空的，如果TestPath为空将会使用TestSetNum参数自动划分出对应个数的测试集。如果使用自动划分机制，那么TestSetNum测试集总数参数必须大于等于TestBatchSize测试集每次读取的批次大小。
神经网络这块可以讲一讲，默认提供的组合是CNN5(CNN5层模型)+BLSTM(Bidirectional LSTM)+CTC，亲测收敛最快，但是训练集过小，实际图片变化很大特征很多的情况下容易发生过拟合。DenseNet可以碰运气在样本量很小的情况下很好的训练出高精度的模型，为什么是碰运气呢，因为收敛快不快随机的初始权重很重要，运气好前500步可能对测试集就有40-60%准确率，运气不好2000步之后还是0，收敛快慢是有一定的运气成分的。

NeuralNet:
  CNNNetwork: CNN5
  RecurrentNetwork: BLSTM
  HiddenNum: 64
  KeepProb: 0.99

隐藏层HiddenNum笔者尝试过8~64，都能控制在很小的模型大小之内，如果想使用DenseNet代替CNN5直接修改如上配置中的CNNNetwork参数替换为：

NeuralNet:
  CNNNetwork: DenseNet
  ......

model.yaml # 模型配置

# ModelName: Corresponding to the model file in the model directory,
# - such as YourModelName.pb, fill in YourModelName here.
# CharSet: Provides a default optional built-in solution:
# - [ALPHANUMERIC, ALPHANUMERIC_LOWER, ALPHANUMERIC_UPPER,
# -- NUMERIC, ALPHABET_LOWER, ALPHABET_UPPER, ALPHABET]
# - Or you can use your own customized character set like: ['a', '1', '2'].
# CharExclude: CharExclude should be a list, like: ['a', '1', '2']
# - which is convenient for users to freely combine character sets.
# - If you don't want to manually define the character set manually,
# - you can choose a built-in character set
# - and set the characters to be excluded by CharExclude parameter.
Model:
  Sites: []
  ModelName: YourModelName-CNN5-H64-150x50
  ModelType: 150x50
  CharSet: ALPHANUMERIC_LOWER
  CharExclude: []
  CharReplace: {}
  ImageWidth: 150
  ImageHeight: 50

# Binaryzation: [-1: Off, >0 and < 255: On].
# Smoothing: [-1: Off, >0: On].
# Blur: [-1: Off, >0: On].
# Resize: [WIDTH, HEIGHT]  
# - If the image size is too small, the training effect will be poor and you need to zoom in.
# - ctc_loss error "No valid path found." happened
Pretreatment:
  Binaryzation: -1
  Smoothing: -1
  Blur: -1

上述的配置只要关注
ModelName、CharSet、ImageWidth、ImageHeight
首先给模型取一个好名字是成功的第一步，字符集CharSet其实大多数情况下不需要修改，一般的图形验证码离不开数字和英文，而且一般来说是大小写不敏感的，不区分大小写，因为打码平台收集的训练集质量参差不齐，有些大写有些小写，不如全部统一为小写，默认ALPHANUMERIC_LOWER则会自动将大写的转为小写，字符集可定制化很灵活，除了配置备注上提供的几种类型，还可以训练中文，自定义字符集用list表示，示例如下：

CharSet: ['常', '世', '宁', '慢', '南', '制', '根', '难']

可以自己根据收集训练集的实际字符集使用率来定义，也可以无脑网上找3500常用字来训练，注意：中文字符集一般比数字英文大很多，刚开始收敛比较慢，需要更久的训练时间，也需要更多的样本量，请量力而行

QQ截图20181204150924.png
形如上图的图片能轻松训练到95%以上的识别率。
ImageWidth、ImageHeight只要和当前图片尺寸匹配即可，其实这里的配置主要是为了方便后面的部署智能策略。
其他的如Pretreatment之下的参数是用来做图片预处理的，因为笔者致力于做一套通用模型，模型只使用了灰度做预处理。其中可选的二值化、均值滤波、高斯模糊均未开启，即使不进行那些预处理该框架已经能够达到很理想的识别效果了，笔者自用的大多数模型都是98%以上的识别率。

3.2 开始训练

按照上面的介绍，配置只要修改极少数的参数对应的值，就可以开启正式的训练之旅了，具体操作如下：
可以直接使用PyCharm的Run，执行trains.py，也可以在激活Virtualenv下使用终端亦或在安装依赖的全局环境下执行

python3 trains.py

剩下的就是等了，看过程，等结果。
正常开始训练的模样应该是这样的：

QQ截图20181204152301.png

训练结束会在项目的out路径下生成一个pb和yaml文件，下面该到部署环节了。

3.3 部署

真的很有必要认真的介绍一下部署项目，比起训练，这个部署项目倾注了笔者更多的心血，为什么呢？
项目地址：https://github.com/kerlomz/captcha_platform

真的值得了解的几点

同时管理多个模型，支持模型热拔插
灵活的版本控制
支持批量识别
服务智能路由策略

首先笔者重写了Tensor Flow的Graph会话管理，设计会话池，允许同时管理多模型，实现多模型动态部署方案。
1）训练好的pb模型只要放在部署项目的graph路径下，yaml模型配置文件放在model，即可被服务发现并加载，
2）如果需要卸载一个正在服务的模型，只需要在model中删除该模型的yaml配置文件，在graph中删除对应的pb模型即可。
3）如果需要更新一个已经服务中的模型，只需修改新版的模型yaml配置文件的版本号高于原模型的版本号，按先放pb后放yaml的顺序，服务便会自动发现新版的模型并加载使用，旧的模型将因版本低于新版模型不会被调用，可以按照上述的卸载方法卸载已被弃用的模型释放内存。
上面的操作中无需重启服务，完全的无缝切换

其次，一套服务想要服务于各式各样的图像识别需求，可以定义一套策略，训练时将所有尺寸一样的图片训练成一个模型，服务根据图片尺寸自动选择使用哪个模型，这样的设计使定制化和通用性共存，等积累到一定多样的训练集时可以将所有的训练集合到一起训练一个通用模型，亦可以彼此独立，每个模型的叠加仅仅增加了少量的内存或显存，网上的方案大多是不同的模型单独部署一套服务，每个进程加载了一整套TensorFlow框架势必是过于庞大和多余的。

用到批量识别需求的人相对少很多这里就不展开介绍了。识别项目提供了多套可选的服务有：gRPC，Flask，Tornado，Sanic，其中Flask和Tornado提供了加密接口，类似于微信公众号开发接口的SecretKey和AccessKey接口，感兴趣的可以在demo.py中阅读调用源码了解。

部署的使用可以经过package.py编译为可执行文件，这样可以免去更换机器环境安装的烦恼，部署项目安装流程同训练项目，项目中提供的requirements.txt已经将所需的依赖都列清楚了，强烈建议部署项目安装cpu版TensorFlow。

Linux：

Tornado：

# 端口 19952
python3 tornado_server.py

Flask

# 方案1，裸启动， 端口 19951
python flask_server.py 
# 方案2，使用gunicorn，端口 5000
pip install gunicorn 
gunicorn -c deploy.conf.py flask_server:app

Sanic：

# 端口 19953
python3 sanic_server.py

gRPC:

# 端口 50054
python3 grpc_server.py

Windows：
Windows平台下都是通过python3 xxx_server.py启动对应的服务，注意，Tornado、Flask、Sanic的性能在Windows平台都大打折扣，gRPC是Google开源的RPC服务，有较为优越的性能。

3.4 调用/测试

1. Flask服务：

请求地址	Content-Type	参数形式	请求方法
http://localhost:19951/captcha/v1	application/json	JSON	POST

具体参数：

参数名	必选	类型	说明
image	Yes	String	Base64 编码
model_site	No	String	网站名，yaml配置中可绑定
model_type	No	String	类别，yaml配置中可绑定

请求为JSON格式，形如：{"image": "base64编码后的图像二进制流"}

返回结果：

参数名	类型	说明
message	String	识别结果或错误消息
code	String	状态码
success	String	是否请求成功

该返回为JSON格式，形如：{"message": "xxxx", "code": 0, "success": true}

2. Tornado服务：

请求地址	Content-Type	参数形式	请求方法
http://localhost:19952/captcha/v1	application/json	JSON	POST

请求参数和返回格式同上

3. Sanic服务：

请求地址	Content-Type	参数形式	请求方法
http://localhost:19953/captcha/v1	application/json	JSON	POST

请求参数和返回格式同上

4. gRPC服务：
需要安装依赖，grpcio、grpcio_tools和对应的grpc.proto文件，可以直接从项目中的示例代码demo.py中提取。

class GoogleRPC(object):

    def __init__(self, host: str):
        self._url = '{}:50054'.format(host)
        self.true_count = 0
        self.total_count = 0

    def request(self, image, model_type=None, model_site=None):

        import grpc
        import grpc_pb2
        import grpc_pb2_grpc
        channel = grpc.insecure_channel(self._url)
        stub = grpc_pb2_grpc.PredictStub(channel)
        response = stub.predict(grpc_pb2.PredictRequest(
            image=image, split_char=',', model_type=model_type, model_site=model_site
        ))
        return {"message": response.result, "code": response.code, "success": response.success}

if __name__ == '__main__':
    result = GoogleRPC().request("base64编码后的图片二进制流")
    print(result)

3.5 奇技淫巧

该项目还可以直接用于识别带颜色的图片，本质是不同的颜色分别训练，调用的时候通过传参区分，如果希望获得图片中红色的文字，就直接通过参数定位到训练红色的模型，希望获取图片中蓝色的图片就通过参数定位到蓝色模型，如：

蓝色.png

红色.png

其实还有很多很多技巧，例如，用生成的样本代替训练集，其实网上的图片验证码大多是采用开源的，稍作修改而已，大多数情况都能被近似生成出来，笔者收集了不少源代码，上述展示的验证码图片不代表任何实际的网站，如有雷同，笔者不承担责任，该项目只能用于学习和交流用途，不得用于非法用途。

后记

如果各位好汉对深度学习、OCR感兴趣的，可以加QQ群（857149419）交流，新群，欢迎大家一起学习和交流。
走过路过点个星在此谢谢大家了！
https://github.com/kerlomz/captcha_trainer
https://github.com/kerlomz/captcha_platform

CNN+BLSTM+CTC的验证码识别从训练到部署
项目地址：https://github.com/kerlomz/captcha_trainer 1. 前言本项目...
linux部署JAVA应用验证码生成失败
linux部署JAVA应用验证码生成失败记部署服务时遇到的问题 linux部署JAVA应用验证码生成失败验证码采...
万物皆可 Serverless 之使用云函数 SCF 快速部署验
验证码识别是搞爬虫实现自动化脚本避不开的一个问题。通常验证码识别程序要么部署在本地，要么部署在服务器端。如果部署在...
批量去除BOM脚本PHP版
今天部署一台新的服务器，部署好后发现验证码不能正确显示。检查了代码，确定没有问题，用Fiddle抓取了验证码的数据...
Centos7+Tomcat8验证码不显示问题
Centos7+Tomcat8验证码不显示问题问题描述：部署的项目在Mac下运行正常，验证码显示正常，但是把项...
解决Could not initilize Class sun.
最近java web项目中涉及到验证码，发现使用weblogic部署到Linux服务器后，验证码无法显示并且错误...
高音
唱歌为什么会有高音的部分，唱高音对于普通人来说都是非常难受的，但是如果我们唱高音的时候可以练到显得特别从容和自然，...
Selenium模拟登录魅族
Selenium模拟登录魅族魅族的验证码采用了第三方「极验」验证码平台，破解比较复杂，故采用打码平台超级鹰进行识...
Linux下Session无法保存
错误描述重新部署项目后验证码一直验证错误，初步判断应该是session无法保存，导致校验验证码时一直无法通过 s...
2018-06-11 rap的部署过程中遇到的坑呀-苦了我
RAP按照原先git中给的流程部署没发现什么问题（之前自己也部署过） 1.但是在打开页面后发现验证码不能够显示： ...

CNN+BLSTM+CTC的验证码识别从训练到部署

1. 前言

2.环境依赖：

Linux

Windows

2.1 本项目环境依赖

2.1.1 Ubuntu 16.04 下的 Python 3.6

2.1.2 Ubuntu 16.04 下的 CUDA/cuDNN

2.1.3 Windows 系统

3 使用

3.1 定义一个模型

3.2 开始训练

3.3 部署

真的值得了解的几点

3.4 调用/测试

3.5 奇技淫巧

后记

相关文章

CNN+BLSTM+CTC的验证码识别从训练到部署

linux部署JAVA应用验证码生成失败

万物皆可 Serverless 之使用云函数 SCF 快速部署验

批量去除BOM脚本PHP版

Centos7+Tomcat8验证码不显示问题

解决Could not initilize Class sun.

高音

Selenium模拟登录魅族

Linux下Session无法保存

2018-06-11 rap的部署过程中遇到的坑呀-苦了我

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

爬虫专题

验证码识别技术

TensorFlow技术帖

Machine Learning & Recommendation & NLP & DL

JS破解&&Android逆向

深度学习-推荐系统-CV-NLP

深度学习