一、csv格式文件
逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。通常,所有记录都有完全相同的字段序列。通常都是纯文本文件。建议使用WORDPAD或是记事本来开启,再则先另存新档后用EXCEL开启,也是方法之一。
还可以看看这个大佬的详细解释:https://www.jianshu.com/p/521f6e302f38
二、代码
import csv
import pandas as pd
oldfile="test.csv"
newfile="new.csv"
#---------------------写入文件------------------------
#读取文件
data = pd.read_csv(oldfile)
#设置新文件为写入模式
fd = open(newfile,'w',newline='')
#以csv格式写入文件
newdata = csv.writer(fd)
for i in range(len(data)):
try:
#获取第i行数据,第一个参数为行,第二个参数为列名
row = data.loc[i,['H','class']]
newdata.writerow(row)
except ValueError:
pass
continue
fd.close()
#---------------------读取文件------------------------
fd = open(newfile,'r')
read2 = csv.reader(fd)
a = list(read2)
print("Here have {} datas in the dataset!".format(len(a)))
for i in range(len(a)):
print(a[i])
fd.close()
网友评论