美文网首页
Python数据处理(一)

Python数据处理(一)

作者: 司马山哥 | 来源:发表于2019-07-16 15:50 被阅读0次

    1缺失值处理

    # 分行列删除全是缺失
    train = train.dropna(how="all",axis=1) 
    train = train.dropna(how="all",axis=0)
    
    # 通过dataframe的columns筛选非空数据
    df[df['Column'].notna()]
    

    2数据描述统计

    涉及数据的相关性、缺失性、取值分布统计、头尾数据展示、热力图可视化。

    prf = pandas_profiling.ProfileReport(df)
    prf.to_file(file_path+'example.html')
    

    3 数据集打乱

    import numpy
    import random
    random.shuffle(data)  # 随机打乱
    """
    数据打乱存在如下问题:
    1 data属于numpy的array数组类型
    2 会将数组的所有元素打乱,dataframe数据源会有异常
    """
    

    相关文章

      网友评论

          本文标题:Python数据处理(一)

          本文链接:https://www.haomeiwen.com/subject/wrsscctx.html