缺失值从缺失的分布来讲可以分为完全随机缺失,随机缺失和完全非随机缺失。
完全随机缺失(missing completely at random,MCAR)
指的是数据的缺失是随机的,数据的缺失不依赖于任何不完全变量或完全变量。
随机缺失(missing at random,MAR)
指的是数据的缺失不是完全随机的,即该类数据的缺失依赖于其他完全变量。
完全非随机缺失(missing not at random,MNAR)
指的是数据的缺失依赖于不完全变量自身。
缺失值从缺失值的所属属性来讲可以分为单值缺失,任意缺失和单调缺失。
单值缺失
如果所有的缺失值都是同一属性,那么这种缺失成为单值缺失。
任意缺失
如果缺失值属于不同的属性,称为任意缺失。
单调缺失
对于时间序列类的数据,可能存在随着时间的缺失,这种缺失称为单调缺失 。
网友评论