dataFrame相关操作
df.shape 返回数据框维度的元组
df.dtypes 返回列的数据类型。Pandas 实际上将 指针 存储为数据框和序列中的字符串,因此,数据类型是 object 而不是 str。了解这一点对数据分析来说并不重要,只需知道字符串在 Pandas 中以对象的形式呈现。
df.info() 显示数据框的简明摘要,包括每列非空值的数量
df.describe() 返回每列数据的有效描述性统计
df.head() 返回数据框中的前几行,默认返回前五行,df.head(20)但是也可以指定你希望返回的行数
df.tail() 返回最后5行,但是也可以指定你希望返回的行数df.tail(2)
可以使用 loc 和 iloc 选择数据。可以点击 这里,了解 loc 和 iloc 的更多信息。loc 使用行标签或列标签选择数据,而 iloc 使用索引号。我们将用它们对下面的数据框进行索引。选择从 'id' 到最后一个均值列的所有列 df.loc[:,'id':'fractal_dimension_mean'],用索引号去指定返回的列数df.iloc[:,:11]。第一个参数是行数,第二个是列数。当需要选择多个返回时,使用iloc更方便,直接使用df.iloc[:, [0,1, 12:21]]是不行的,可以使用np.r_[0,1, 12:21]将目标转化为pandas可识别的类型,最终写法df.iloc[:,np.r_[0,1, 12:21]]
网友评论