pandas: Python数据分析库
pandas是一个专门用于数据分析的开源python库,是使用python语言研究和分析数据集的基础工具。pandas是以numpy为基础进行设计的,因而使得pandas可以和其他大多数模块兼容,还能借助numpy模块在计算方面性能高的优势。
安装
- 使用pypi安装
pip install pandas
- 在linux系统上安装
debian类系统:
sudo apt-get install python3-pandas
SUSE类系统:
sudo zypper install python3-pandas
- 使用Anaconda安装
conda list pandas --检查是否安装pandas
conda install pandas -- 安装pandas
conda update pandas -- 更新pandas
- 使用源代码安装
git clone git://github.com/pydata/pandas.git -- 链接可能失效,可以在GitHub中搜索
cd pandas
python3 setup.py install
如果想获取安装最新的安装包或者避开依赖问题,可以在Christoph Gohlke 的Window系统python扩展包仓库下载相应的whl文件,安装方法如下:
pip install xxxxxxx.whl
- 验证pandas是否安装成功
>>>import pandas
pandas一共有两大核心数据结构,所有的数据分析相关的事物都是围绕这两种数据结构进行的.这两种数据结构分别是:
Series(序列)
DataFrame(数据框)
Series这类数据结构用于存储一个序列这样的一维数据,DataFrame用于存储多维数据
- Series对象和DataFrame对象内部都有一个Index对象,这种结构使得两种数据结构具有很强的可操作性.
网友评论