美文网首页
Pandas常用方法

Pandas常用方法

作者: 慢慢_Loney | 来源:发表于2020-03-02 21:36 被阅读0次

    操作Excel

    • 读取Excel

      df = pd.read_excel(file_path, sheet_name = 索引或者名称)
      
    • 存储Excel

      df.to_excel('文件名.xls')
      
    • 拼接数据

      def sum_excel(self,sheet_index):
            file_name = listdir(self.path)
            sum_df = []
            for name in file_name:
                file_path = self.path + name
                df = pd.read_excel(file_path, sheet_name = sheet_index)
                sum_df.append(df)
            df = pd.concat(sum_df)
            df.to_excel('{}.xlsx'.format(sheet_index), index = False)
      

    切片和索引

    • iloc - 通过位置获取行数据

      df.iloc[行号,列号]
      df.iloc[:,N] # 获取第N列的数据
      
    • loc - 通过标签索引行数据

      df.loc['行名称','列名称']
      

    统计方法

    • 统计重复值

      df.groupby(by="列名").size
      

    排序

    • sort_values()

      df.sort_values("列名",ascending=False)
      # ascending默认为True,升序排列,为False是降序排列。  
      
    • nlargest()

      df.nlargest(5,"列名") 
      # 待研究
      

    相关文章

      网友评论

          本文标题:Pandas常用方法

          本文链接:https://www.haomeiwen.com/subject/mibikhtx.html