pandas数据导出

作者: 千千罐 | 来源:发表于2020-11-01 18:28 被阅读0次

Pandas学习笔记
pandas数据导出
Pandas 5. 导入导出数据
pandas操作技巧
Pandas数据分析基础流程及操作
Pandas 导入导出数据
项目-pymysql迁移数据库+用powerbi定时展示仪表盘
Pandas实战——数据导入导出与pandas配置
怎么制作pdf报告，使用Pandas、Jinja和WeasyPr
pandas常用操作

导出函数都是DataFrame类的方法，写入则是Pandas的方法
Pandas中关于数据框导出的相关函数列表如下：

df.to_clipboard()   df.to_feather() df.to_latex()   df.to_pickle()  df.to_string()
df.to_csv()         df.to_gbq()     df.to_msgpack() df.to_records() df.to_timestamp()
df.to_dense()       df.to_hdf()     df.to_numpy()   df.to_sparse()  df.to_xarray()
df.to_dict()        df.to_html()    df.to_parquet() df.to_sql() 
df.to_excel()       df.to_json()    df.to_period()  df.to_stata()

以下函数都有对应的读入函数：

df.to_clipboard()   df.to_feather()     df.to_html()        df.to_pickle()
df.to_csv()         df.to_gbq()         df.to_json()        df.to_sql()
df.to_excel()       df.to_hdf()         df.to_msgpack()

本文先主要介绍以下参数，陆续更新。。。。。。

DataFrame.to_csv() ：导出数据主要是文本格式

DataFrame.to_csv() 导出成 \t 或 , 分割的文本格式文件

1）函数详解：

DataFrame.to_csv(path_or_buf=None, sep=', ', na_rep='', float_format=None, columns=None,
                 header=True, index=True, index_label=None, mode='w', encoding=None, 
                 compression=None, quoting=None, quotechar='"', line_terminator='\n', 
                 chunksize=None, tupleize_cols=None, date_format=None, doublequote=True,
                 escapechar=None, decimal='.')

path_or_buf=None ：字符串或文件句柄，默认无文件路径或对象，如果没有提供，结果将返回为字符串
sep ：默认字符 , ，设置输出文件字段分隔符
na_rep ：字符串，默认为 ''，浮点数格式字符串
float_format ：字符串，默认为 None浮点数格式字符串
columns ：序列，可选列写入
header ：如果给定字符串列表，则假定为列名的别名。
index ：布尔值，默认为Ture。写入行名称（索引）
index_label ：字符串或序列，或False，默认为None。如果需要，可以使用索引列的列标签。如果没有给出，且标题和索引为True，则使用索引名称。如果数据文件使用多索引，则应该使用这个序列。如果值为False，不打印索引字段。在R中使用index_label=False 更容易导入索引.
mode ：值为‘str’，字符串。Python写模式，默认“w”
encoding ：string, optional。编码：字符串，可选。表示在输出文件中使用的编码的字符串，Python 2上默认为“ASCII”和Python 3上默认为“UTF-8”。
compression ：string, optional。字符串，可选项。表示在输出文件中使用的压缩的字符串，允许值为“gzip”、“bz2”、“xz”，仅在第一个参数是文件名时使用。
line_terminator ：string, default ‘\n’。字符串，默认为 ‘\n’。在输出文件中使用的换行字符或字符序列
quoting ：optional constant from csv module。CSV模块的可选常量。默认值为to_csv.QUOTE_MINIMAL。如果设置了浮点格式，那么浮点将转换为字符串，因此csv.QUOTE_NONNUMERIC会将它们视为非数值的。
quotechar ：string (length 1), default ‘”’。字符串（长度1），默认“”。用于引用字段的字符
doublequote ：boolean, default True。布尔，默认为Ture。控制一个字段内的quotechar
escapechar ：string (length 1), default None。字符串（长度为1），默认为None。在适当的时候用来转义sep和quotechar的字符
chunksize ：int or None。int或None。一次写入行
tupleize_cols ：默认为False。从版本0.21.0中删除：此参数将被删除，并且总是将多索引的每行写入CSV文件中的单独行
（如果值为false）将多索引列作为元组列表（如果TRUE）或以新的、扩展的格式写入，其中每个多索引列是CSV中的一行。
date_format ：默认为None。字符串对象转换为日期时间对象
decimal ：默认’。’。字符识别为小数点分隔符。例如。欧洲数据使用 ’，’