3、Pandas 数据结构 - DataFrame
DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)
3.1创建DataFrame对象
3.1.1列表创建DataFame对象
可以使用单一列表或嵌套列表创建一个DataFrame
(1)
在没有指定索引的时候行列的索引都是默认从0开始的。
(2)
通过colums语句给行索引赋值,通过index给列索引赋值
输出结果为:
输出结果3.1.2字典嵌套列表创建DataFame对象
data 字典中,键对应的值的元素长度必须相同(也就是列表长度相同)。如果传递了索引,那么索引的长度应该等于数组的长度;如果没有传递索引,那么默认情况下,索引将是 range(n),其中 n 代表数组长度。如:
输出结果为:
3.1.3列表嵌套字典创建DataFame对象
输出结果为
3.1.4 Series创建DataFrame对象
输出结果为:
3.2列索引操作DataFrame
3.2.1列索引选取数据列
通过直接在df后定义数据的列标题就可以选取
输出结果为:
3.2.2 列索引添加数据列
添加数据列的方式有两种,一种是直接赋值
还可以对已经存在的数列进行运算,结果为:
另一种是采用insert()语句
输出结果为:
3.2.3 列索引删除数据列
通过 del 和 pop() 都能够删除DataFrame中的数据列。
输出结果为:
3.3行索引操作DataFrame
3.3.1 行标签索引选取数据行
Pandas可以使用 loc 属性返回指定索引对应到某一行
输出结果为:
3.3.2切片操作多行选取
输出结果为:
这里切片的顺序也是左闭右开,从0开始。
3.3.3 添加数据行
输出结果为
3.3.4 删除数据行
采用drop()语句,但是如果索引标签存在重复,那么它们将被一起删除。
输出结果为:
网友评论