一、常用数据分析库
安装命令:pip install / conda install *(如果安装了 Anaconda 可使用后面那个命令,但是缺点就是 conda install 会安装或更新库所以来的各种库,而 pip install 不会更新) *
- pip install numpy (建议:https://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy 在这里下载对应版本的 whl文件,安装下载之后我们以后就没必要去安装 mkl 了,本地安装格式:pip install 路径\文件名.whl)
- pip install scipy
- pip install pandas
- pip install matplotlib
简介:
Nuympy : 提供常用的数值数组、矩阵等函数
优点:1.是基于向量化的运算 2.进行数值运算时 Numpy 数组彼 list 效率高
Scipy: 是一种使用 NumPy 来做高等数学、信号处理、优化、统计的扩展包(https://docs.scipy.org/doc/)
Pandas: 是一种构建于 Numpy 的高级数据结构和精巧工具,快速简单的处理数据。
数据结构:Series 和 DataFrame
Matplotlib: 绘图库
二、常用高级数据分析库
-
自然语言处理工具包
安装:pip install -U nltk
应用:文本提取、词汇切分、词频分析、词袋模型、情感分析 -
图计算和社交网络分析
安装:pip install -U python-igraph (直接这样安装可能会出现问题)
解决办法:
1- 打开网址:https://www.lfd.uci.edu/~gohlke/pythonlibs/
2- 下载对应 python 版本的 whl (笔者是 wind7x64位 py 是 3.6):
1522148091(1).jpg
3- 下载完之后,使用命令窗口指定到该目录下,并以 pip install 文件名 进行执行:
1522148244(1).jpg
-
基于 Scipy 之上的一个用于机器学习的 Py 模块
安装:pip install -U scikit-learn -
统计分析模块
安装:pip install statsmodels
如果安装失败则可以去这个网址:
https://www.lfd.uci.edu/~gohlke/pythonlibs/ 搜索该模块并下载对应的版本,然后安装:
QQ截图20180507160217.png
三、常用挖掘模块
- 文本挖掘模块
安装:pip install gensim
到此就基本 Over 啦~
网友评论