美文网首页
随机打乱Pandas Dataframe数据

随机打乱Pandas Dataframe数据

作者: LabVIEW_Python | 来源:发表于2021-03-15 06:24 被阅读0次

    在深度学习应用中,通常用Pandas Dataframe数据来维护一张图片-标签映射表,如下所示:

    id class_num
    0 train_0000.jpg 0
    1 train_0001.jpg 0
    2 train_0002.jpg 0
    3 train_0003.jpg 0
    4 train_0004.jpg 0

    在训练过程中,我们不希望模型对训练数据的输入顺序产生依赖,所以,每轮(epoch)训练,都将该图片-标签映射表随机打乱。实现随机打乱Pandas Dataframe数据最方便的方法是用sklearn.utils.shuffle()函数,范例代码如下:

    train_images = pd.read_csv(FILE, usecols=['id', 'class_num'])
    print(train_images.head(10)) # 没有打乱的数据
    

    id class_num
    0 train_0000.jpg 0
    1 train_0001.jpg 0
    2 train_0002.jpg 0
    3 train_0003.jpg 0
    4 train_0004.jpg 0
    5 train_0005.jpg 1
    6 train_0006.jpg 1
    7 train_0007.jpg 2
    8 train_0008.jpg 3
    9 train_0009.jpg 3

    import sklearn
    df = sklearn.utils.shuffle(train_images) #随机打乱
    print(df.head(10))
    

    id class_num
    862 train_0862.jpg 2
    327 train_0327.jpg 2
    596 train_0596.jpg 1
    181 train_0181.jpg 0
    131 train_0131.jpg 3
    880 train_0880.jpg 0
    256 train_0256.jpg 2
    70 train_0070.jpg 3
    604 train_0604.jpg 0
    1042 train_1042.jpg 0

    相关文章

      网友评论

          本文标题:随机打乱Pandas Dataframe数据

          本文链接:https://www.haomeiwen.com/subject/garqcltx.html