导出函数都是DataFrame类的方法,写入则是Pandas的方法
Pandas中关于数据框导出的相关函数列表如下:
df.to_clipboard() df.to_feather() df.to_latex() df.to_pickle() df.to_string()
df.to_csv() df.to_gbq() df.to_msgpack() df.to_records() df.to_timestamp()
df.to_dense() df.to_hdf() df.to_numpy() df.to_sparse() df.to_xarray()
df.to_dict() df.to_html() df.to_parquet() df.to_sql()
df.to_excel() df.to_json() df.to_period() df.to_stata()
以下函数都有对应的读入函数:
df.to_clipboard() df.to_feather() df.to_html() df.to_pickle()
df.to_csv() df.to_gbq() df.to_json() df.to_sql()
df.to_excel() df.to_hdf() df.to_msgpack()
本文先主要介绍以下参数,陆续更新 。。。。。。
- DataFrame.to_csv() :导出数据主要是文本格式
- DataFrame.to_csv() 导出成 \t 或 , 分割的文本格式文件
1)函数详解:
DataFrame.to_csv(path_or_buf=None, sep=', ', na_rep='', float_format=None, columns=None,
header=True, index=True, index_label=None, mode='w', encoding=None,
compression=None, quoting=None, quotechar='"', line_terminator='\n',
chunksize=None, tupleize_cols=None, date_format=None, doublequote=True,
escapechar=None, decimal='.')
- path_or_buf=None :字符串或文件句柄,默认无文件路径或对象,如果没有提供,结果将返回为字符串
- sep :默认字符 , ,设置输出文件字段分隔符
- na_rep :字符串,默认为 '',浮点数格式字符串
- float_format :字符串,默认为 None浮点数格式字符串
- columns :序列,可选列写入
- header :如果给定字符串列表,则假定为列名的别名。
- index :布尔值,默认为Ture。写入行名称(索引)
- index_label :字符串或序列,或False,默认为None。如果需要,可以使用索引列的列标签。如果没有给出,且标题和索引为True,则使用索引名称。如果数据文件使用多索引,则应该使用这个序列。如果值为False,不打印索引字段。在R中使用index_label=False 更容易导入索引.
- mode :值为‘str’,字符串。Python写模式,默认“w”
- encoding :string, optional。编码:字符串,可选。表示在输出文件中使用的编码的字符串,Python 2上默认为“ASCII”和Python 3上默认为“UTF-8”。
- compression :string, optional。字符串,可选项。表示在输出文件中使用的压缩的字符串,允许值为“gzip”、“bz2”、“xz”,仅在第一个参数是文件名时使用。
- line_terminator :string, default ‘\n’。字符串,默认为 ‘\n’。在输出文件中使用的换行字符或字符序列
- quoting :optional constant from csv module。CSV模块的可选常量。默认值为to_csv.QUOTE_MINIMAL。如果设置了浮点格式,那么浮点将转换为字符串,因此csv.QUOTE_NONNUMERIC会将它们视为非数值的。
- quotechar :string (length 1), default ‘”’。字符串(长度1),默认“”。用于引用字段的字符
- doublequote :boolean, default True。布尔,默认为Ture。控制一个字段内的quotechar
- escapechar :string (length 1), default None。字符串(长度为1),默认为None。在适当的时候用来转义sep和quotechar的字符
- chunksize :int or None。int或None。一次写入行
- tupleize_cols :默认为False。从版本0.21.0中删除:此参数将被删除,并且总是将多索引的每行写入CSV文件中的单独行
(如果值为false)将多索引列作为元组列表(如果TRUE)或以新的、扩展的格式写入,其中每个多索引列是CSV中的一行。 - date_format :默认为None。字符串对象转换为日期时间对象
- decimal :默认’。’。字符识别为小数点分隔符。例如。欧洲数据使用 ’,’
参考:https://blog.csdn.net/u010801439/article/details/80033341
网友评论