python dataframe 实战

作者: Thinkando | 来源:发表于2018-09-08 10:04 被阅读36次

python dataframe 实战
第三方库-Pandas-基础
21-SparkSQL02
PySpark的使用
python:pandas 合并多个DataFrame
Spark DataFrame 实战
Pandas实战——DataFrame
dataframe增加一行的操作，如果是大量数据的代替方案
pandas之df.duplicated()用法
Python网络爬虫实战之十四：Scrapy结合scrapy-s

1

需求，把NAN值大于50%的行与列删除，剩下的NAN用这一列最小值的1/2填补

import pandas as pd
import numpy as np
df=pd.read_csv('ost20180713.csv',header=None,sep=',')
rows,cols=df.shape

# 删除行
for i in range(rows):
    if df.loc[i].count()<int(cols/2):
        df.drop([i],inplace=True)
#删除列
for i in range(cols):
    if df[i].count()<int(rows/2):
        df.drop([i],inplace=True,axis=1)
#重新编号行与列
new_rows,new_cols=df.shape
df.reset_index(drop=True, inplace=True)
df.columns=[num for num in range(new_cols)]
#取最小的1/2 填充
for i in range(1,new_cols):
    a=df[i][1]
    for j in df[i][1:6]:
        if j == 0 or a == 0:
            pass
        elif j is np.nan:
            pass
        elif a > j:
            a = j
    c = float(a) / 2
    df = df.fillna({i: c}, inplace=True)
print(df)

df.to_csv("ost_laomei.csv")

网友评论

本文标题：python dataframe 实战

本文链接：https://www.haomeiwen.com/subject/mcskgftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

python dataframe 实战

1

相关文章

python dataframe 实战

第三方库-Pandas-基础

21-SparkSQL02

PySpark的使用

python:pandas 合并多个DataFrame

Spark DataFrame 实战

Pandas实战——DataFrame

dataframe增加一行的操作，如果是大量数据的代替方案

pandas之df.duplicated()用法

Python网络爬虫实战之十四：Scrapy结合scrapy-s

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读