标准数据类型
Python 3 中有六个标准的数据类型:
Number(数字)
String(字符串)
List(列表)
Tuple(元组)
Set(集合)
Dictionary(字典)
Python 3 的六个标准数据类型中:
不可变数据(3 个):Number(数字)、String(字符串)、Tuple(元组);
可变数据(3 个):List(列表)、Dictionary(字典)、Set(集合)。
NumPy 数据结构
NumPy(Numerical Python)是高性能科学计算和数据分析的基础包 主要包含 ndarray(N-dimensional array object) ufunc(universal function object)两种数据结构
multidimensional array of objects of all the same type(list of lists)
和list 相比存储更紧凑,读写更快,可进行向量和矩阵运算
Scipy Scipy 在numpy arrays 的基础上提供大量的科学计算函数和工具。
Pandas 数据结构
pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。
Series: Series可以运用ndarray或字典的几乎所有索引操作和函数,融合了字典和ndarray的优点。
DataFrame :DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共用同一个索引)。
DataFrame可以通过类似字典的方式或者.columnname的方式将列获取为一个Series。行也可以通过位置或名称的方式进行获取。
网友评论