美文网首页我爱编程
Day28 - 2018-05-02

Day28 - 2018-05-02

作者: 谁共我醉明月 | 来源:发表于2018-05-02 00:56 被阅读0次

    dataFrame相关操作

    df.shape    返回数据框维度的元组

    df.dtypes    返回列的数据类型。Pandas 实际上将 指针 存储为数据框和序列中的字符串,因此,数据类型是 object 而不是 str。了解这一点对数据分析来说并不重要,只需知道字符串在 Pandas 中以对象的形式呈现。

    df.info()    显示数据框的简明摘要,包括每列非空值的数量

    df.describe()    返回每列数据的有效描述性统计

    df.head()    返回数据框中的前几行,默认返回前五行,df.head(20)但是也可以指定你希望返回的行数

    df.tail()    返回最后5行,但是也可以指定你希望返回的行数df.tail(2)

    可以使用 loc 和 iloc 选择数据。可以点击 这里,了解 loc 和 iloc 的更多信息。loc 使用行标签或列标签选择数据,而 iloc 使用索引号。我们将用它们对下面的数据框进行索引。选择从 'id' 到最后一个均值列的所有列 df.loc[:,'id':'fractal_dimension_mean'],用索引号去指定返回的列数df.iloc[:,:11]。第一个参数是行数,第二个是列数。当需要选择多个返回时,使用iloc更方便,直接使用df.iloc[:, [0,1, 12:21]]是不行的,可以使用np.r_[0,1, 12:21]将目标转化为pandas可识别的类型,最终写法df.iloc[:,np.r_[0,1, 12:21]]

    相关文章

      网友评论

        本文标题:Day28 - 2018-05-02

        本文链接:https://www.haomeiwen.com/subject/fxcqrftx.html