美文网首页
2020-03-08 学习记录

2020-03-08 学习记录

作者: fan的心情记录 | 来源:发表于2020-03-08 20:08 被阅读0次
    数据预处理

    第一行代码输出前十行数据,发现有缺失值,age_is_null打印空值。若为空则显示true。age_null_true会把缺失数据打印出来。最后一行代码则可以显示出来一共有几个缺失值。

    用平均值来替代缺失值

    mean_age=sum(data["age"])/len(data["age"])

    print(mean_age) #打印出来是nan  因为元数据中有缺失值 所以计算不出来。讲非缺失的数据拿出来进行单独计算。

    good_ages=data["age"][" age_is_null "=false]

    correct_mean_age=sum( good_ages )/len( good_ages )

    #也可以使用mean函数

    data["age"].mean()也可以输出结果

    打印一二三等舱的平均价格

    可以直接用数据透视表(方便)

    数据透视表 删除缺失值

    重新定义索引值 .rest_index

    根据age来进行划分 三类 用分好类的age建立数据透视表

    相关文章

      网友评论

          本文标题:2020-03-08 学习记录

          本文链接:https://www.haomeiwen.com/subject/zblddhtx.html