信息熵
熵是对平均不确定性的度量
互信息
得知特征Y的信息而使得对标签X的信息的不确定性减少的程度
可以用于衡量两个概率分布的相似性
python计算信息熵
def calc_ent(x):
"""
calculate shanno ent of x
"""
x_value_list = set([x[i] for i in range(x.shape[0])])
ent = 0.0
for x_value in x_value_list:
p = float(x[x == x_value].shape[0]) / x.shape[0]
logp = np.log2(p)
ent -= p * logp
return ent
网友评论