美文网首页我爱编程
Day15 - 2018-04-17

Day15 - 2018-04-17

作者: 谁共我醉明月 | 来源:发表于2018-04-17 22:44 被阅读0次

数据的相关性

皮尔逊积矩相关系数可以测量两组数据是否线性相关,它将两组数据分别减去其平均值后再分别除以其标准差得到同一测量维度的两组数据的乘积的平均值,它的结果是处在[-1, 1]内,若其值为正数,表示一个值随另一个的增大而增大(正线性相关),负数则是负线性相关,一个值随另一个的增大而减小,如接近于0则表示相关度较小

计算 Pearson's r的代码

默认情况下,Pandas 的 std() 函数使用贝塞耳校正系数来计算标准偏差。调用 std(ddof=0) 可以禁止使用贝塞耳校正系数。

之前使用过axis=0或axis=1来指定针对某个坐标轴计算,也可以使用axis='index'(同0)或axis='columns'(同1)。其实axis='index'计算的是一列的值,即计算所有index相同的值;axis='columns'是计算一行的值,即所有columns相同的值。

相关文章

网友评论

    本文标题:Day15 - 2018-04-17

    本文链接:https://www.haomeiwen.com/subject/wrgpkftx.html