- pandas 的describe函数的参数详解
- 官网
- 用法:data.describe()
-
参数有三个:describe(percentiles, include,)
官网.png-
percentiles, 第一个参数可以设定数值型特征的统计量,默认是[.25, .5, .75],也就是返回25%,50%,75%数据量时的数字,但是这个可以修改的
-
include,第二个参数默认是只计算数值型特征的统计量,当输入include=['O'],会计算离散型变量的统计特征。
describe.png
可以看出它直接给出了非空数量count,唯一值种类unique,出现最多的类型top和出现次数freq,简直是贴心。这对以后提特征绝对是个便利。
此外当你传参数是‘all’的时候,会把数值型和离散型特征的统计都进行显示。 -
exclude. 第三个参数的设计就更贴心了,第二个参数是你可以指定选那些,第三个参数就是你可以指定不选哪些,人性化设计。这个参数默认不丢弃任何列,相当于无影响。
-
原文档:https://blog.csdn.net/xckkcxxck/article/details/84799220
-
参考文档:https://blog.csdn.net/j904538808/article/details/80747599
-
网友评论