随机打乱Pandas Dataframe数据

作者: LabVIEW_Python | 来源:发表于2021-03-15 06:24 被阅读0次

随机打乱Pandas Dataframe数据
Pandas-创建数据
2020-02-12
2021-12-31 Python-23
Python 数据分析基础（numpy、pandas）
文科生学Python系列9: Pandas入门
文科生学Python系列10: Pandas鸢尾花案例
使用python进行数据分析<五>(pandas入门
第三方库-Pandas-基础
5.3 DataFrame对象

在深度学习应用中，通常用Pandas Dataframe数据来维护一张图片-标签映射表，如下所示：

id class_num
0 train_0000.jpg 0
1 train_0001.jpg 0
2 train_0002.jpg 0
3 train_0003.jpg 0
4 train_0004.jpg 0

在训练过程中，我们不希望模型对训练数据的输入顺序产生依赖，所以，每轮(epoch)训练，都将该图片-标签映射表随机打乱。实现随机打乱Pandas Dataframe数据最方便的方法是用sklearn.utils.shuffle()函数，范例代码如下：

train_images = pd.read_csv(FILE, usecols=['id', 'class_num'])
print(train_images.head(10)) # 没有打乱的数据

id class_num
0 train_0000.jpg 0
1 train_0001.jpg 0
2 train_0002.jpg 0
3 train_0003.jpg 0
4 train_0004.jpg 0
5 train_0005.jpg 1
6 train_0006.jpg 1
7 train_0007.jpg 2
8 train_0008.jpg 3
9 train_0009.jpg 3

import sklearn
df = sklearn.utils.shuffle(train_images) #随机打乱
print(df.head(10))

id class_num
862 train_0862.jpg 2
327 train_0327.jpg 2
596 train_0596.jpg 1
181 train_0181.jpg 0
131 train_0131.jpg 3
880 train_0880.jpg 0
256 train_0256.jpg 2
70 train_0070.jpg 3
604 train_0604.jpg 0
1042 train_1042.jpg 0

网友评论

本文标题：随机打乱Pandas Dataframe数据

本文链接：https://www.haomeiwen.com/subject/garqcltx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

随机打乱Pandas Dataframe数据

相关文章

随机打乱Pandas Dataframe数据

Pandas-创建数据

2020-02-12

2021-12-31 Python-23

Python 数据分析基础（numpy、pandas）

文科生学Python系列9: Pandas入门

文科生学Python系列10: Pandas鸢尾花案例

使用python进行数据分析<五>(pandas入门

第三方库-Pandas-基础

5.3 DataFrame对象

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读