美文网首页
4dataframe 统计分类电影

4dataframe 统计分类电影

作者: mll_497f | 来源:发表于2021-06-30 21:26 被阅读0次

import pandas pd

from matplotlib import pyplot as pyplot

df=pd.read_csv("movie.csv")

#统计分类列表

temp_data=df['Genre'].str.split(",").tolist() #[[],[],[]]

genre_list=list(set[j for i in temp_data  for j in i])

#生成0的列

zeros_colmns=pd.DataFrame(np.zeros(temp_data.shape[0],len(genre_list)),columns=genre_list)

for i in range(df.shape[0]):

      #temp_data["sci-fi","muc"] 

      # temp_data 是列表, 取第2行里的多列zero_colmns.loc[1,["sci-fi","muc"] ]=1

      zeros_colmns.loc[i,temp_data[i]]=1

#统计每个分类电影的数量和

genre_count=zeros_df.sum(axis=0)

#统计

genre_count=genre_count.sort_values()

#绘图

plt.figure(figsize=(20,8),dpi=80)

_x=genre_count.index

_y=genre_count.values

plt.bar(range(len(_x)),_y)

plt.xticks(range(len(_x)),_x)

plt.show()

2..join()  默认情况下它是把行行索引相同的数据和并到一起

t.join(t2)  在t的基础上把t2以列添加到t的列上,如果没有则是nan(如果点后的行数比点前的行数多,则只显示点前的。如t.join(t2),如果点前的行数比点后的多则会出现nan ,如t2.join(t))

merge 不懂~~~~ armin不懂

相关文章

  • 4dataframe 统计分类电影

    import pandas pd from matplotlib import pyplot as pyplot ...

  • 工具:数据分析(统计学)

    方法:描述统计、推断统计 数据:数值数据和分类数据(类别、文本,不能进行计算) 分类数据描述统计:频数统计、频数百...

  • 分类统计字符

    分类统计字符 描述 用户输入一个字符串,分别统计其中小写字母、大写字母、数字、空格和其他字符的个数,并在一行内输出...

  • 统计学习方法之朴素贝叶斯

    1.概述 朴素贝叶斯分类是贝叶斯分类器的一种,贝叶斯分类算法是统计学的一种分类方法,利用概率统计知识进行分类,其分...

  • 2019-05-10《健康产业统计分类(2019)》编制说明

    4月9日,国家统计局发布《健康产业统计分类(2019)》,为健康产业划出清晰边界。据悉,《统计分类》保留了《健康服...

  • 总的理解

    统计的分类 1. 微信订阅号解螺旋上的总结 1. 数据的分类 统计学中的数据分类 定类数据(Nominal):最低...

  • 学习笔记

    描述统计学: 1. 分为数值数据和分类数据,可互相转化。 分类数据 - 频数统计/频数百分比:单纯对各分类计数 数...

  • 贝叶斯建模

    贝叶斯分类算法,是统计学的一种分类方法,它是利用贝叶斯定理的概率统计知识,对离散型的数据进行分类的算法优点:算法易...

  • Elasticsearch v1.7简单实用DSL查询

    返回指定字段:_source 统计查询分类:facets

  • 分类--贝叶斯分类

    1、贝叶斯分类方法是统计学的分类方法,它利用概率统计知识预测给定元组属于特定类的概率。 2、贝叶斯分类源于贝叶斯定...

网友评论

      本文标题:4dataframe 统计分类电影

      本文链接:https://www.haomeiwen.com/subject/bxfqcktx.html