美文网首页数据分析Python
Pandas进阶修炼120题之题目3:统计每种编程语言出现的次数

Pandas进阶修炼120题之题目3:统计每种编程语言出现的次数

作者: 默直 | 来源:发表于2021-07-23 11:59 被阅读0次

为帮助学习pandas,特意从和鲸社区中提炼出120道经典数据处理常见操作例题,从基础入门到进阶来更快速、更专业的角度理解pandas。主要包括:

  • Pandas基础
  • Pandas进阶
  • 金融数据处理
  • NumPy科学计算
  • 一些补充

https://www.heywhale.com/mw/project/5ef96ce863975d002c95fd8a/content

正文:

将字典创建为DataFrame

data_dict={
   "Grammer":["python","C","Java","GO",np.nan,"SQL","PHP","python"],
   "Score":[1,2,np.nan,4,5,6,7,10]
}
data = pd.DataFrame(data_dict)
data

[图片上传失败...(image-bc992f-1623504000376)]

需求分析:

根据题目分析:需要统计每种编程语言出现的次数

数据理解:

1.首先确定列名,是Grammer;

2.统计次数,浏览发现python重复两次,其他均是一次,则最终结果同样如此。

代码实现:

方法一:利用value_counts()实现次数统计。

data['Grammer'].value_counts()

[图片上传失败...(image-d73f67-1623504000376)]

方法二:利用groupby()实现次数统计

data.groupby('Grammer')['Grammer'].count()

[图片上传失败...(image-937c21-1623504000376)]

总结:通过以上两种方法均能实现统计次数这个功能,但有没发现问题呢?NaN值并没有打印出来,而是智能过滤掉,这是什么原因呢?

相关文章

网友评论

    本文标题:Pandas进阶修炼120题之题目3:统计每种编程语言出现的次数

    本文链接:https://www.haomeiwen.com/subject/qrwieltx.html