html解析-HTMLParser

html解析-HTMLParser

作者: 非鱼2018 | 来源:发表于2019-10-20 09:53 被阅读0次

python之HTMLParser解析HTML文档
Swift 最简单的方式来解析HTML
html解析-HTMLParser
python 爬取知乎回答
python模块之HTMLParser: 解析html,获取ur
【Python入门】32.常用内置模块之 HTMLParser
Python进阶记录之requests模块！
python HtmlParser
记一次jsoup的使用
lxml的使用方法

HTMLParser解析网页主要是通过继承HTMLParser类来编写自定义函数

from html.parser import HTMLParser
from html.entities import name2codepoint

class MyHTMLParser(HTMLParser):
    def __init__(self):
        HTMLParser.__init__(self)
       self.flag = 'N'
       
    #通过标记或属性个数，属性值来判断获取需要的元素
    def handle_starttag(self, tag, attrs):
        if tag=='a' and len(attrs)==3 and attrs[0][1]=='title':
            self.flag = 'Y'
        #print('<%s>' % tag)

    def handle_endtag(self, tag):
        self.flag = 'N'
        #print('</%s>' % tag)

    def handle_startendtag(self, tag, attrs):
        print('<%s/>' % tag)
   #获取元素的文本值
    def handle_data(self, data):
        if self.flag == 'Y':
            print("文章标题：{}".format(data))
        #print(data)

 #def handle_comment(self, data):
 #   pass
 #   #print('<!--', data, '-->')
# 解析类似这种&nbsp;
  #  def handle_entityref(self, name):
  #     pass
  #     #print('&%s;' % name)
# 解析&#1234
 # def handle_charref(self, name):
 #      pass
  #     #print('&#%s;' % name)
if __name_-='__main__':
    with open('result.html','r',encoding='utf-8') as f:
        files=f.read()
        f.close()
    parser = MyHTMLParser()
    parser.feed(files)

相关文章

python之HTMLParser解析HTML文档
python之HTMLParser解析HTML文档 HTMLParser是Python自带的模块，使用简单，能够很...
Swift 最简单的方式来解析HTML
HTMLParser HTMLParser说白了就是对HTML网页的数据的解析，HTML本质上是XML的子集，但是...
html解析-HTMLParser
HTMLParser解析网页主要是通过继承HTMLParser类来编写自定义函数
python 爬取知乎回答
1. 安装库 htmlparser 用来解析 html 。 Beautiful Soup 是一个可以从 HTML ...
python模块之HTMLParser: 解析html,获取ur
HTMLParser是python用来解析html的模块。它可以分析出html里面的标签、数据等等，是一种处理ht...
【Python入门】32.常用内置模块之 HTMLParser
摘要：教你如何用Python自带的HTMLParser解析HTML文本。 *写在前面：为了更好的学习python，...
Python进阶记录之requests模块！
回顾在《Python进阶记录之HTMLParser模块》中，我们介绍了Python内置的HTML解析库HTMLP...
python HtmlParser
HtmlParser，是python自带的一个解析html/xml等结构化数据的工具。一、常用属性和方法介绍 H...
记一次jsoup的使用
Jsoup是用于解析HTML，就类似XML解析器用于解析XML。 Jsoup它解析HTML成为真实世界的HTML。...
lxml的使用方法
使用lxml解析HTML代码 1.解析html字符串：使用lxml.etree.HTML进行解析，示例代码如下： ...

网友评论

本文标题：html解析-HTMLParser

本文链接：https://www.haomeiwen.com/subject/ggursctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|html解析-HTMLParser|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！