pandas统计

作者: 9fbe1619f5ab | 来源:发表于2020-05-08 16:23 被阅读0次

Pandas统计计算和描述
pandas统计
腾讯广告算法大赛——统计日曝光量+数据清洗
【Chapter 5.3】Pandas的汇总和计算描述统计
lupengday03
pandas入门（3）：处理缺失数据
python: 计算数据落在各区间的频数
pandas统计函数
3.8Pandas的统计计算和描述
DataFrame.value_counts, pandas1.

import pandas as pd

import numpy as np

汇总与计算描述统计

Series

在describe中，count为非NaN的数量，mean为平均值，std为标准差

DataFrame

describe汇总统计方法无axis参数

统计方法默认axis=0纵向统计，默认skipna=True排除缺失值，可指定axis=1横向统计，skipna=False统计缺失值

>>> sr = pd.Series([1.6, np.nan, 45, -3])

>>> sr.mean()

14.533333333333333

>>> sr.mean(skipna=False)

nan

对于非数值型数据，describe产生另一种汇总统计

>> sr = pd.Serise(list('kaigva;rlkgjaworpiy'))

>>> sr.describe()

count 19 # 非NaN数量

unique 13 # 唯一值数量

top a # 最高频元素

freq 3 # 最高频次数

dtype: object

唯一值

seriesObj.unique() # dataframe无此方法

unique按值的发现顺序返回，结果是未排序的

值计数

pd.value_counts(obj, sort=False)

用于series

serise默认不计算缺失值

升序排列，设置参数 ascending = True

想要得出计数占比，可以加参数 normalize=True

用于dataframe

dataframe计数时，没有对应值的部分会填充NaN

成员判断

obj.isin()

网友评论

本文标题：pandas统计

本文链接：https://www.haomeiwen.com/subject/cwgfnhtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

pandas统计

汇总与计算描述统计

Series

DataFrame

唯一值

值计数

用于series

用于dataframe

成员判断

相关文章

Pandas统计计算和描述

pandas统计

腾讯广告算法大赛——统计日曝光量+数据清洗

【Chapter 5.3】Pandas的汇总和计算描述统计

lupengday03

pandas入门（3）：处理缺失数据

python: 计算数据落在各区间的频数

pandas统计函数

3.8Pandas的统计计算和描述

DataFrame.value_counts, pandas1.

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读