整个数据挖掘基础阶段会用到Matplotlib numpy pandas ta-lib等库,为了统一版本号在环境中使用,将所有的库及其版本放到了文件requirements.txt
问题一:如何创建一个虚拟环境?
1. 安装pipenv
1 pip3 install piping
2 创建虚拟环境
1 mkdir project
2 cd project
3 piping install
初始化好虚拟环境后,会在项目目录下生成2个文件Pipfile和Pipfile.lock。为pipenv包的配置文件,代替原来的 requirement.txt。
项目提交时,可将Pipfile文件和Pipfile.lock文件一并提交,待其他开发克隆下载,根据此Pipfile 运行命令pipenv install --dev生成自己的虚拟环境。
Pipfile.lock文件是通过hash算法将包的名称和版本,及依赖关系生成哈希值,可以保证包的完整性。
3 安装python包(module)
用pycharm先打开咱们刚刚创建的project,然后创建APP目录,在app目录下创建如下spider.py文件,导入requests库,并没有安装这个包。
安装requests包,命令如下:
1 piping install requests
这样在pycharm里就能看到requests已经可用,并且能抓取到网页了
4 查看安装包及依赖关系
命令如下
1 piping graph
一、数据挖掘基础环境安装与使用
1.1 库的安装
matplotlib==2.2.2
numpy==1.14.2
pandas==0.20.3
TA-lib==0.4.16 技术指标库
tables==3.4.2 hdf5
jupyter==1.0.0 数据分析与展示的平台
2.Matplotlib
网友评论