Pandas

作者: great_yuan | 来源:发表于2019-11-13 15:46 被阅读0次

    九、

    八、统计某一属性相同值出现次数

    比如要统计’label’这一列各个值出现的次数, 使用df_train.loc[:,'label'].value_counts()即可

    df["author"].value_counts()

    七、遍历

    1.value_count

    for i,v in voiceUuid_value_count.items():

    2.

    六、筛选、删除特定行、列

    https://www.cnblogs.com/cocowool/p/8421997.html

    删除具体列 df.drop('成交数量',axis=1)

    删除具体行 df.drop('2018-2-3')

    删除特定数值的行(删除成交金额小于10000) df[ df['成交金额'] > 10000]

    删除某列包含特殊字符的行  df[ ~ df['证券名称'].str.contains('联通') ]

    如果想取包含某些字符的记录,可以去掉~ df[ df['证券名称'].str.contains('联通') ]

    https://blog.csdn.net/songyunli1111/article/details/79306639

    按标签来删除列 df.drop(['B','C'],axis=1,inplace=True)

    按序号来删除列 x = [1,2]  df.drop(df.columns[x],axis=1,inplace=True)

    按序号来删除行 df.drop([0,1],inplace=True)        #默认axis=0

    五、Pandas合并 去重

    hotelDataDf = pandas.concat([hotelDataDf08,hotelDataDf09,hotelDataDf10])

    cHotelDataDf = hotelDataDf.drop_duplicates()

    四、Pandas查询最大值

    行最大值

    https://codeday.me/bug/20171209/105857.html

    列最大值

    https://blog.csdn.net/ssswill/article/details/85260320

    三、DataFrame 保存为文件

    https://blog.csdn.net/tz_zs/article/details/81137998

    read_csv = pd.read_csv("read_data.csv")

    二、创建Pandas

    二、行数

    获得Pandas数据的行数

    dataFrame -> len(data.index)

    series_movie_akDf = cMovieDataDf['ak'].value_counts()

    一、行、列

    1.pandas取dataframe特定行/列

    https://www.cnblogs.com/nxf-rabbit75/p/10105271.html

    按条件取行

    选取等于某些值的行记录 用 ==

    df.loc[df[‘column_name’] == some_value]

    条件选取1

    fData31700056 = cMapDataDf[cMapDataDf.event_id.str.contains('31700056',na=False)]

    条件选取2

    time_df_100 = time_df[time_df.minute<100]

    2.行、列互换

    相关文章

      网友评论

          本文标题:Pandas

          本文链接:https://www.haomeiwen.com/subject/bxohictx.html