美文网首页
Web信息提取

Web信息提取

作者: 闫_锋 | 来源:发表于2018-05-16 11:04 被阅读9次

    Beautiful Soup:HTML和XM的解析库
    -提供了解析HTML和XML等Web信息的功能
    -又名beautifulsoup4或bs4,可以加载多种解析引擎
    -常与网络爬虫库搭配使用,如Scrapy, requests等

    Re:正则表达式解析和处理功能库
    -提供了定义和解析正则表达式的一批通用功能
    -可用于各类场景,包括定点的Web信息提取
    -Python最主要的标准库之一,无需安装

    Python-Goose: 提取文章类型Web页面的功能库
    -提供了对Web页面中文章信息/视频等元数据的提取功能
    -针对特定类型Web页面,应用覆盖面较广
    -Python最主要的Web信息提取库

    相关文章

      网友评论

          本文标题:Web信息提取

          本文链接:https://www.haomeiwen.com/subject/myqpdftx.html