pandas读取csv,数据类型,可以是csv格式,也可以是txt,read_csv参数很多,
pandas.read_csv(filepath_or_buffer, sep=', ', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression='infer', thousands=None, decimal=b'.', lineterminator=None, quotechar='"', quoting=0, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=False, error_bad_lines=True, warn_bad_lines=True, skipfooter=0, skip_footer=0, doublequote=True, delim_whitespace=False, as_recarray=False, compact_ints=False, use_unsigned=False, low_memory=True, buffer_lines=None, memory_map=False, float_precision=None)
说几个我经常用的,
1.filepath_or_buffer, 路径跟python文件在一个文件夹下可以直接使用文件名,其他的可以用绝对路径,但是在win下面,路径复制下来是‘C:\Users\dingdingmiao\Desktop’这样的,但是python识别不了,要用,把/换成
2.sep=', ',分列用的分隔符,默认是逗号,因为csv格式是用逗号分隔数据,假如不是csv文件,就直接导入,然后print出来,看到用什么分隔符,照搬到这里就行。
3.encoding=None,一般都是utf-8,就不用管它,但是出现乱码,可以试试‘gbk’
4.index_col=None,不指定index的话pandas会自己生成一列,在pandas保存出去再读取回来的时候就会发现有一列unnamed:0,把这一列当成index就很好
5.dtype=None,指定列的数据类型,比如股票代码默认导入的话,深市000001就会变成1,用dtype={'code':str},就能把它变成str。
to_csv:
跟read_csv基本一样,只是第一参数是存到哪里。
其他的还有read_json,read_excel.read_sql.等等大同小异。
网友评论