美文网首页
Pandas data clean demo

Pandas data clean demo

作者: geeker_leon | 来源:发表于2019-02-16 15:58 被阅读0次
image
# coding:utf-8

import pandasas pd

from decimalimport Decimal

df = pd.DataFrame({'姓名': ['小乔', '貂蝉', '虞姬', '甄姬', '大乔', '大乔'],

                  '身高': [158, 165, 167, 164, 163, 163],

                  '胸围': [80, 85, 88, 86, 83, 83],

                  '腰围': [65, 70, None, 72, 68, 68],

                  '臀围': [83, 90, 92, 88, 88, 88]})

print df

# Remove duplicated data

df.drop_duplicates(inplace=True)

print df

# Fill None data

df['腰围'].fillna(df['腰围'].mean(), inplace=True)

print df

# Add new column

df['三围指数'] = ((df['胸围'] + df['腰围'] + df['臀围']) / df['身高'] *100).apply(

lambda x: Decimal(str(x)).quantize(Decimal('0.00')))

print df

相关文章

网友评论

      本文标题:Pandas data clean demo

      本文链接:https://www.haomeiwen.com/subject/fsxieqtx.html