美文网首页菜鸟
用python处理html代码的转义与还原

用python处理html代码的转义与还原

作者: taojy123 | 来源:发表于2017-08-10 12:10 被阅读0次

    转义 escape:

    import cgi
    s = cgi.escape("""& < >""") # s = '&amp; &lt; &gt;'
    

    反转义 unescape:

    #使用标准库
    from htmllib import HTMLParser 
    h = HTMLparser.HTMLParser() 
    s = h.unescape('& < >')    # s = u'& < >' 
    
    #使用BeautifulSoup 
    from bs4 import BeautifulSoup 
    soup = BeautifulSoup(html, convertEntities=BeautifulSoup.HTML_ENTITIES)
    

    引用于:
    http://fredericiana.com/2010/10/08/decoding-html-entities-to-text-in-python/
    https://wiki.python.org/moin/EscapingHtml

    http://blog.163.com/gaocheng2008@yeah/blog/static/93043209201431632148859/

    相关文章

      网友评论

        本文标题:用python处理html代码的转义与还原

        本文链接:https://www.haomeiwen.com/subject/arhhrxtx.html