注:df = pd.read_csv('train.csv')
1. DataFrame和Series的异同点:
区别:
Series,只是一个一维数据结构,它由index和value组成。
DataFrame,是一个二维结构,除了拥有index和value之外,还拥有column。
联系:
DataFrame由多个Series组成,无论是行还是列,单独拆分出来都是一个Series。
2. 查看DataFrame每列的名称可以用:df.columns;若要转成列表的形式:df.columns.values.tolist()
3. 查看特定列的数据可以用如下代码表示:df['Cabin']或者df.Cabin或者df[['Cabin']]。不过df['Cabin']和df[['Cabin']]的区别在于:前者出来的是Series格式,而后者还是DataFrame格式。
4. 删除特定列可以用del语句或者drop语句。
5. 筛选条件可以用df[df['']<]等表示,注意对交并集的差别。
6. loc语句和iloc语句的区别:
引用格式发生变化,前者引用某列可以直接用列名查找,而后者可以用index进行查找。
第二处不同是iloc 主要定位的是相对位置;loc 定位的是DataFrame本身的index。
网友评论