import csv
#导入类库
csvFile = open("../files/test.csv", 'w+')
#创建或打开一个文件
try:
writer = csv.writer(csvFile)
#拿到写入文件
writer.writerow(('number', 'number plus 2', 'number times 2'))
#写入
for i in range(10):
writer.writerow( (i, i+2, i*2))
finally:
#关闭文件
csvFile.close()
采集维基百科写入csv
import csv
from urllib.request import urlopen
from bs4 import BeautifulSoup
html = urlopen("http://en.wikipedia.org/wiki/Comparison_of_text_editors")
bsObj = BeautifulSoup(html)
# 主对比表格是当前页面上的第一个表格
table = bsObj.findAll("table",{"class":"wikitable"})[0]
rows = table.findAll("tr")
csvFile = open("../files/editors.csv", 'wt', newline='', encoding='utf-8')
writer = csv.writer(csvFile)
try:
for row in rows:
csvRow = []
for cell in row.findAll(['td', 'th']):
csvRow.append(cell.get_text())
writer.writerow(csvRow)
finally:
csvFile.close()
如果你有很多 HTML 表格,且每个都要转换成 CSV 文件,或者许多 HTML 表格都要汇总到一个 CSV 文件,那么把这个程序整合到爬虫里以解决问题非常好。但是,如果你只需要做一次这种事情,那么更好的办法就是:复制粘贴。选择 HTML 表格内容然后粘贴到 Excel 文件里,可以另存为 CSV 格式,不需要写代码就能搞定!
网友评论