美文网首页
Pandas描述性统计

Pandas描述性统计

作者: 傅越驰Ameeya | 来源:发表于2020-12-28 23:53 被阅读0次

    有很多方法用来集体计算DataFrame的描述性统计信息和其他相关操作。 其中大多数是sum(),mean()等聚合函数,但其中一些,如sumsum(),产生一个相同大小的对象。 一般来说,这些方法采用轴参数,就像ndarray.{sum,std,...},但轴可以通过名称或整数来指定:

    数据帧(DataFrame) - “index”(axis=0,默认),columns(axis=1)
    下面创建一个数据帧(DataFrame),并使用此对象进行演示本章中所有操作。
    示例
    import pandas as pd
    import numpy as np

    Create a Dictionary of series

    d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack',
    'Lee','David','Gasper','Betina','Andres']),
    'Age':pd.Series([25,26,25,23,30,29,23,34,40,30,51,46]),
    'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8,3.78,2.98,4.80,4.10,3.65])}

    Create a DataFrame

    df = pd.DataFrame(d)
    print df
    Python
    执行上面示例代码,得到以下结果 -
    Age Name Rating
    0 25 Tom 4.23
    1 26 James 3.24
    2 25 Ricky 3.98
    3 23 Vin 2.56
    4 30 Steve 3.20
    5 29 Minsu 4.60
    6 23 Jack 3.80
    7 34 Lee 3.78
    8 40 David 2.98
    9 30 Gasper 4.80
    10 51 Betina 4.10
    11 46 Andres 3.65
    Shell
    sum()方法
    返回所请求轴的值的总和。 默认情况下,轴为索引(axis=0)。
    import pandas as pd
    import numpy as np

    Create a Dictionary of series

    d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack',
    'Lee','David','Gasper','Betina','Andres']),
    'Age':pd.Series([25,26,25,23,30,29,23,34,40,30,51,46]),
    'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8,3.78,2.98,4.80,4.10,3.65])}

    Create a DataFrame

    df = pd.DataFrame(d)
    print df.sum()
    Python
    执行上面示例代码,得到以下结果 -
    Age 382
    Name TomJamesRickyVinSteveMinsuJackLeeDavidGasperBe...
    Rating 44.92
    dtype: object
    Shell
    每个单独的列单独添加(附加字符串)。
    axis=1示例
    此语法将给出如下所示的输出,参考以下示例代码 -
    import pandas as pd
    import numpy as np

    Create a Dictionary of series

    d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack',
    'Lee','David','Gasper','Betina','Andres']),
    'Age':pd.Series([25,26,25,23,30,29,23,34,40,30,51,46]),
    'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8,3.78,2.98,4.80,4.10,3.65])}

    Create a DataFrame

    df = pd.DataFrame(d)
    print df.sum(1)
    Python
    执行上面示例代码,得到以下结果 -
    0 29.23
    1 29.24
    2 28.98
    3 25.56
    4 33.20
    5 33.60
    6 26.80
    7 37.78
    8 42.98
    9 34.80
    10 55.10
    11 49.65
    dtype: float64
    Shell
    mean()示例返回平均值,参考以下示例代码 -
    import pandas as pd
    import numpy as np

    Create a Dictionary of series

    d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack',
    'Lee','David','Gasper','Betina','Andres']),
    'Age':pd.Series([25,26,25,23,30,29,23,34,40,30,51,46]),
    'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8,3.78,2.98,4.80,4.10,3.65])}

    Create a DataFrame

    df = pd.DataFrame(d)
    print df.mean()
    Python
    执行上面示例代码,得到以下结果 -
    Age 31.833333
    Rating 3.743333

    相关文章

      网友评论

          本文标题:Pandas描述性统计

          本文链接:https://www.haomeiwen.com/subject/jqvxoktx.html