import pandas as pd
df = pd.read_csv(csv_path)
1. 根据某列排序
df按照t这个字段排序
df.sort_values(by="t", ascending=True, inplace = True)
- inplace默认为False,如果该值为False,那么原来的df顺序没变,只是返回的是排序的
- ascending=True,表示从小到大排序
2.更换列名
df.rename(columns={'t':'p'}, inplace = True)
3. 保存到txt文件
df.to_csv(path, sep='\t', index=False, header=None)
保存后的文件不包含列名和index,以空格作为分隔符
4.将某列移动到固定位置
cols = list(df)
cols.insert(0, cols.pop(cols.index('t')))
将t这列移动到index=0的位置
5.将txt数据转化为csv数据
def txt2csv(input_path, csv_path):
in_txt = csv.reader(open(input_path, "r"), delimiter = ' ',escapechar='\n')
out_csv =csv.writer(open(csv_path, 'w'))
out_csv.writerows(in_txt)
6.截取一段作为测试数据
def test_data_slice(input_path, output_path):
event = pd.read_csv(input_path)
data = event[500000:1000000]
data.to_csv(output_path, index = False)
网友评论