美文网首页
kaggle学习 - 缺失值处理

kaggle学习 - 缺失值处理

作者: Rooooooooong | 来源:发表于2018-11-15 20:11 被阅读0次

    如何检测补缺失值的效果?
    补完以后看“补的数据”和“原生数据”的分布是否有差异。这里有两种合适的可视化方法,散点图、密度图和条状图。

    散点图

    散点图

    密度图

    密度图

    条状图

    条状图

    可以发现补的效果还可以,但是下图就出现了意外。


    可能的原因是m选取的过大,m是拟合的轮数。这里具体什么作用我也不是很清楚,存个疑。以后具体查看mice包及相关论文。
    tempData1 <- mice(df3,m=50,seed = 12345)
    modelFit1 <- with(tempData1,lm(CPI~Unemployment))
    

    参考
    Imputing Missing Data with R

    相关文章

      网友评论

          本文标题:kaggle学习 - 缺失值处理

          本文链接:https://www.haomeiwen.com/subject/vpuefqtx.html