注:pandas一般处理数据较慢,如果需要处理百万以上的数据,请转成list进行处理。结束后,在转回pandas
1、引入库
import pandas as pd
2、读文件
file = pd.read_csv("url")
3、 转成数据帧
file = pd.DataFrame(file)
4、条件选择
file = file[file['数值属性']>5]
#or
file = file[file['字符属性']=='char']
5、构建空数据帧(大多数用于新构建数据)
content_txt = pd.DataFrame({"content":{}})
6、保存
# 保存成txt,分隔符为\t
label_txt.to_csv("10k3k.txt",sep='\t', index=False)
or
# 保存为csv
label_txt.to_csv("文件名",index=False)
#如果想去除表头
label_txt.to_csv("文件名",index=False,header=False)
7、关键字排序
_s = [[k,sa_array[k]] for k in sorted(sa_array.keys())]
网友评论