美文网首页
爬虫之BeautifulSoup(一)--安装与基本语法

爬虫之BeautifulSoup(一)--安装与基本语法

作者: 五秋木 | 来源:发表于2017-11-10 12:40 被阅读0次
    1. 安装BeautifulSoup
      使用管理员模式进行pip下载安装
      pip install beautifulsoup4
      此时安装的模块所在的路径为:C:\Program Files\Python36\Lib\site-packages

    2. 导入BeautifulSoup
      from bs4 import BeautifulSoup

    3. 使用基本语句

    demo = r. text   # 其中r为通过requests获取的信息
    soup = BeautifulSoup(demo,"html.parser") 
    print(soup.prettify())
    
    Beautiful Soup库解析器

    此时soup可以作为一个BeautifulSoup类,该类作为html或者xml文档的全部内容。


    Beautiful Soup类的基本元素
    soup.title   # soup的title标签
    soup.a     # soup的a标签
    soup.a.name   # 标签a的名字
    soup.a.attrs     #字典格式的属性列表
    soup.a.string   # 非属性字符串
    # 注释中的string与一般标签相同,只显示字符串,
    # 无法区分,可以使用type来区分
    type(soup.a.string)   # <class 'bs4.element.NavigableString'>
    type(soup.b.string)    #<class 'bs4.element.Comment'>
    
    基本元素

    相关文章

      网友评论

          本文标题:爬虫之BeautifulSoup(一)--安装与基本语法

          本文链接:https://www.haomeiwen.com/subject/orlbmxtx.html