美文网首页
第一章:第二节pandas基础--6.16

第一章:第二节pandas基础--6.16

作者: 小憨豆 | 来源:发表于2021-06-16 19:36 被阅读0次

    注:df = pd.read_csv('train.csv')

    1. DataFrame和Series的异同点:

    区别:

    Series,只是一个一维数据结构,它由index和value组成。

    DataFrame,是一个二维结构,除了拥有index和value之外,还拥有column。

    联系:

    DataFrame由多个Series组成,无论是行还是列,单独拆分出来都是一个Series。

    2. 查看DataFrame每列的名称可以用:df.columns;若要转成列表的形式:df.columns.values.tolist()

    3. 查看特定列的数据可以用如下代码表示:df['Cabin']或者df.Cabin或者df[['Cabin']]。不过df['Cabin']和df[['Cabin']]的区别在于:前者出来的是Series格式,而后者还是DataFrame格式。

    4. 删除特定列可以用del语句或者drop语句。

    5. 筛选条件可以用df[df['']<]等表示,注意对交并集的差别。

    6. loc语句和iloc语句的区别:

    引用格式发生变化,前者引用某列可以直接用列名查找,而后者可以用index进行查找。

    第二处不同是iloc 主要定位的是相对位置;loc 定位的是DataFrame本身的index。

    相关文章

      网友评论

          本文标题:第一章:第二节pandas基础--6.16

          本文链接:https://www.haomeiwen.com/subject/bprfyltx.html