美文网首页Python新世界
要考三级了!我用Python把有道词典单词转化成EXCEL!答题

要考三级了!我用Python把有道词典单词转化成EXCEL!答题

作者: 919b0c54458f | 来源:发表于2018-11-16 20:02 被阅读4次

    import xml.etree.ElementTree as ET

    import pandas as pd

    import numpy as np

    tree = ET.parse('words.xml')

    root = tree.getroot()

    words = pd.DataFrame(columns = ['word','trans','phonetic'])

    for item in root:

    df = pd.DataFrame({'word': item[0].text,

    'trans': item[1].text,

    'phonetic': item[2].text},

    index = item)

    print(df)

    words = pd.concat([words, df], ignore_index = True)

    words = words.drop_duplicates()

    words.to_excel('words1.xlsx', sheet_name = '1')

    进群:548377875   即可获取小编精心准备的资料全套呢!

    在这里面有两个问题目前没有看懂,一个是

    words = words.drop_duplicates()

    ,为什么要用这个,应为不用他的话每个单词会打印5遍,没办法,我就把重复项去掉了,我也不知道为什么会打印5遍。另外一个就是在sublime text 3中写

    words.to_excel('words1.xlsx', sheet_name = '1')

    的时候,会出现

    UnicodeEncodeError: 'gbk' codec can't encode character '\u028c' in position 134: illegal multibyte sequence

    可能是因为,‘gbk’搞不定音标吧,我猜的啊,不知道怎么解决,反正我在jupyter notebook中跑出来了。

    是不是非常简单!赶紧用起来吧~!

    相关文章

      网友评论

        本文标题:要考三级了!我用Python把有道词典单词转化成EXCEL!答题

        本文链接:https://www.haomeiwen.com/subject/vokvfqtx.html