美文网首页工作生活
pandas中std和numpy的std区别

pandas中std和numpy的std区别

作者: CanCanJ | 来源:发表于2019-07-03 23:50 被阅读0次

    pandas中Series.std的官方文档


    numpy中numpy.std的官方文档

    原理

        计算标准差时,需要注意numpy中的std和pandas的std在计算标准差时,默认的计算结果会存在不一致的问题。
        原因在于默认情况下,
        numpy计算的为总体标准偏差,ddof=0;一般在拥有所有数据的情况下,计算所有数据的标准差时使用,即最终除以n,而非n-1;
        pandas计算的为样本标准偏差,ddof=1;一般在只有部分数据,但需要求得总体的标准差时使用,当只有部分数据时,根据统计规律,除以n时计算的标准差往往偏小,因此需要除以n-1,即n-ddof;

        实际使用时需要注意,并且根据数据情况选择合适的函数,在数据量较大时,推荐使用numpy进行计算。

    速度区别

    速度由快到慢依次:

    s1 = pd.Series([1,2,3,4,5])
    #速度由快至慢
    np.std(s1.values) > s1.std(ddof=0) > np.std(s1)
    

    企业小程序系统软件定制请看

    相关文章

      网友评论

        本文标题:pandas中std和numpy的std区别

        本文链接:https://www.haomeiwen.com/subject/dnahhctx.html