美文网首页
创建保存csv

创建保存csv

作者: IthinkIcanfly | 来源:发表于2018-10-19 09:27 被阅读0次
    
    import csv
    #导入类库
    csvFile = open("../files/test.csv", 'w+')
    #创建或打开一个文件
    try:
        writer = csv.writer(csvFile)
        #拿到写入文件
        writer.writerow(('number', 'number plus 2', 'number times 2'))
        #写入
        for i in range(10):
            writer.writerow( (i, i+2, i*2))
    finally:
        #关闭文件
        csvFile.close()
    

    采集维基百科写入csv

    import csv
    from urllib.request import urlopen
    from bs4 import BeautifulSoup
    
    html = urlopen("http://en.wikipedia.org/wiki/Comparison_of_text_editors")
    bsObj = BeautifulSoup(html)
    # 主对比表格是当前页面上的第一个表格
    table = bsObj.findAll("table",{"class":"wikitable"})[0]
    rows = table.findAll("tr")
    csvFile = open("../files/editors.csv", 'wt', newline='', encoding='utf-8')
    writer = csv.writer(csvFile)
    try:
        for row in rows:
            csvRow = []
            for cell in row.findAll(['td', 'th']):
                csvRow.append(cell.get_text())
            writer.writerow(csvRow)
    finally:
        csvFile.close()
    

    如果你有很多 HTML 表格,且每个都要转换成 CSV 文件,或者许多 HTML 表格都要汇总到一个 CSV 文件,那么把这个程序整合到爬虫里以解决问题非常好。但是,如果你只需要做一次这种事情,那么更好的办法就是:复制粘贴。选择 HTML 表格内容然后粘贴到 Excel 文件里,可以另存为 CSV 格式,不需要写代码就能搞定!

    相关文章

      网友评论

          本文标题:创建保存csv

          本文链接:https://www.haomeiwen.com/subject/sjzezftx.html