索引对象
Pandas中的索引对象,即负责管理对象的轴标签和其他元数据(例如,轴名称),在构建Series或DataFrame对象时,所用到的数组或其他序列的标签都会转换为一个Index,在上述Series和DataFrame对象的讲解中也对索引对象有部分讲解。
注意:Index对象是不可修改的。
对于索引对象,使用者无须了解太多细节,但索引对象是Pandas数据结构中重要的组成部分,因此接下来简单介绍有关Index对象的重要内容。
Pandas中含有不同类型的Index对象,具体如表4.2所示。
对象 | 说明 |
---|---|
Index | 最泛化的Index对象,将轴标签表示为一个由Python对象组成的NumPy数组 |
Int64Index | 针对整数的特殊Index |
MultiIndex | “层次化”索引对象,表示单个轴上的多层索引,可以看成由元组组成的数组 |
DatetimeIndex | 存储纳秒级时间戳(用NumPy的datetime64类型表示) |
PeriodIndex | 针对Period数据(时间间隔)的特殊Index |
对于索引对象来说,每个索引都含有一些属性和函数,用来设置逻辑并解决该索引包含数据的常见问题,具体如表4.3所示。
属性和函数 | 说明 |
---|---|
append | 连接另一个Index对象,产生一个新的Index |
diff | 计算差集,并得到一个Index |
intersection | 计算交集 |
union | 计算并集 |
isin | 计算一个指示各值是否包含在参数集合中的布尔型数组 |
delete | 删除索引i处的元素,并得到新的Index |
drop | 删除传入的值,并得到新的Index |
insert | 将元素插入到索引i处,并得到新的Index |
is_monotonic | 当各元素均大于等于前一个元素时,返回True |
is_unique | 当Index没有重复值时,返回True |
unique | 计算Index中唯一值的数组 |
网友评论