美文网首页
pandas数据导出

pandas数据导出

作者: 千千罐 | 来源:发表于2020-11-01 18:28 被阅读0次

导出函数都是DataFrame类的方法,写入则是Pandas的方法
Pandas中关于数据框导出的相关函数列表如下:

df.to_clipboard()   df.to_feather() df.to_latex()   df.to_pickle()  df.to_string()
df.to_csv()         df.to_gbq()     df.to_msgpack() df.to_records() df.to_timestamp()
df.to_dense()       df.to_hdf()     df.to_numpy()   df.to_sparse()  df.to_xarray()
df.to_dict()        df.to_html()    df.to_parquet() df.to_sql() 
df.to_excel()       df.to_json()    df.to_period()  df.to_stata()   

以下函数都有对应的读入函数:

df.to_clipboard()   df.to_feather()     df.to_html()        df.to_pickle()
df.to_csv()         df.to_gbq()         df.to_json()        df.to_sql()
df.to_excel()       df.to_hdf()         df.to_msgpack() 

本文先主要介绍以下参数,陆续更新 。。。。。。

  • DataFrame.to_csv() :导出数据主要是文本格式
  1. DataFrame.to_csv() 导出成 \t, 分割的文本格式文件

1)函数详解:

DataFrame.to_csv(path_or_buf=None, sep=', ', na_rep='', float_format=None, columns=None,
                 header=True, index=True, index_label=None, mode='w', encoding=None, 
                 compression=None, quoting=None, quotechar='"', line_terminator='\n', 
                 chunksize=None, tupleize_cols=None, date_format=None, doublequote=True,
                 escapechar=None, decimal='.')
  • path_or_buf=None :字符串或文件句柄,默认无文件路径或对象,如果没有提供,结果将返回为字符串
  • sep :默认字符 , ,设置输出文件字段分隔符
  • na_rep :字符串,默认为 '',浮点数格式字符串
  • float_format :字符串,默认为 None浮点数格式字符串
  • columns :序列,可选列写入
  • header :如果给定字符串列表,则假定为列名的别名。
  • index :布尔值,默认为Ture。写入行名称(索引)
  • index_label :字符串或序列,或False,默认为None。如果需要,可以使用索引列的列标签。如果没有给出,且标题和索引为True,则使用索引名称。如果数据文件使用多索引,则应该使用这个序列。如果值为False,不打印索引字段。在R中使用index_label=False 更容易导入索引.
  • mode :值为‘str’,字符串。Python写模式,默认“w”
  • encoding :string, optional。编码:字符串,可选。表示在输出文件中使用的编码的字符串,Python 2上默认为“ASCII”和Python 3上默认为“UTF-8”。
  • compression :string, optional。字符串,可选项。表示在输出文件中使用的压缩的字符串,允许值为“gzip”、“bz2”、“xz”,仅在第一个参数是文件名时使用。
  • line_terminator :string, default ‘\n’。字符串,默认为 ‘\n’。在输出文件中使用的换行字符或字符序列
  • quoting :optional constant from csv module。CSV模块的可选常量。默认值为to_csv.QUOTE_MINIMAL。如果设置了浮点格式,那么浮点将转换为字符串,因此csv.QUOTE_NONNUMERIC会将它们视为非数值的。
  • quotechar :string (length 1), default ‘”’。字符串(长度1),默认“”。用于引用字段的字符
  • doublequote :boolean, default True。布尔,默认为Ture。控制一个字段内的quotechar
  • escapechar :string (length 1), default None。字符串(长度为1),默认为None。在适当的时候用来转义sep和quotechar的字符
  • chunksize :int or None。int或None。一次写入行
  • tupleize_cols :默认为False。从版本0.21.0中删除:此参数将被删除,并且总是将多索引的每行写入CSV文件中的单独行
    (如果值为false)将多索引列作为元组列表(如果TRUE)或以新的、扩展的格式写入,其中每个多索引列是CSV中的一行。
  • date_format :默认为None。字符串对象转换为日期时间对象
  • decimal :默认’。’。字符识别为小数点分隔符。例如。欧洲数据使用 ’,’

参考:https://blog.csdn.net/u010801439/article/details/80033341

相关文章

网友评论

      本文标题:pandas数据导出

      本文链接:https://www.haomeiwen.com/subject/vxklmktx.html