美文网首页
Python_Scrapy-第三方模块安装与使用

Python_Scrapy-第三方模块安装与使用

作者: Just_do_1995 | 来源:发表于2019-01-19 11:10 被阅读0次

第三方模块的安装

1、request库的安装与使用

requests库本质上就是模拟了我们用浏览器打开一个网页,发起请求是的动作。它能够迅速的把请求的html源文件保存到本地

  • 安装方式</br>
    “win+R”输入“cmd”打开命令提示符面板,键入“pip install requests”,安装pip第三方模块。
  • 查看安装结果</br>
    “win+R”输入“cmd”打开命令提示符面板,键入“pip list”,查看通过pip所安装的所有第三方模块。
  • 简单使用</br>
  1. 首先我们先导入requests这个包

    import requests</br></br>

我们来吧百度的index页面的html源码抓取到本地,并用r变量保存</br>
注意这里,网页前面的http://一定要写出来,它并不能像真正的浏览器一样帮我们补全http协议

r = requests.get("http://www.baidu.com")

将下载到的内容打印一下:

print(r.text)

  1. 所获取的百度源码文件

2、bs4库的安装与使用

bs4库 是解析、遍历、维护、“标签树“的功能库。

  • 安装方式</br>
    “win+R”输入“cmd”打开命令提示符面板,键入“pip install beautifulsoup4”,安装pip第三方模块。
  • 查看安装结果</br>
    “win+R”输入“cmd”打开命令提示符面板,键入“pip list”,查看通过pip所安装的所有第三方模块。
  • 简单使用</br>
    1、以一段HTML代码将作为例子
<html>
<head>
    <title>The Dormouse's story</title>
</head>
<body>
<p class="title"><b>The Dormouse's story</b></p>

<p class="story">Once upon a time there were three little sisters; and their names were
    http://example.com/elsie" class="sister" id="link1">Elsie,
    http://example.com/lacie" class="sister" id="link2">Lacie and
    http://example.com/tillie" class="sister" id="link3">Tillie;
    and they lived at the bottom of a well.</p>

<p class="story">...</p>
</body>
</html>

2、下面我们开始用bs4库解析这一段html网页代码。

#导入bs4模块
from bs4 import BeautifulSoup
soup = BeautifulSoup(html,'html.parser')
#输出结果
print(soup.prettify())

'''
OUT:

# <html>
#  <head>
#   <title>
#    The Dormouse's story
#   </title>
#  </head>
#  <body>
#   <p class="title">
#    <b>
#     The Dormouse's story
#    </b>
#   </p>
#   <p class="story">
#    Once upon a time there were three little sisters; and their names were
#    <a class="sister" href="http://example.com/elsie" id="link1">
#     Elsie
#    </a>
#    ,
#    <a class="sister" href="http://example.com/lacie" id="link2">
#     Lacie
#    </a>
#    and
#    <a class="sister" href="http://example.com/tillie" id="link2">
#     Tillie
#    </a>
#    ; and they lived at the bottom of a well.
#   </p>
#   <p class="story">
#    ...
#   </p>
#  </body>
# </html>
'''

通俗一点说就是: bs4库把html源代码重新进行了格式化,
从而方便我们对其中的节点、标签、属性等进行操作。

3、BS4库的解析器的安装与使用

我们所选用的是lxml解析器

  • 安装</br>
    pip install lxml
  • 具体使用</br>
    1、依旧使用上一节HTML文档</br>
    2、使用lxml进行解析
import bs4


#首先我们先将html文件已lxml的方式做成一锅汤
soup = bs4.BeautifulSoup(open('Beautiful Soup 爬虫/demo.html'),'lxml')

#我们把结果输出一下,是一个很清晰的树形结构。
#print(soup.prettify())

'''
OUT:

<html>
 <head>
  <title>
   The Dormouse's story
  </title>
 </head>
 <body>
  <p class="title">
   <b>
    The Dormouse's story
   </b>
  </p>
  <p class="story">
   Once upon a time there were three little sisters; and their names were
   <a class="sister" href="http://example.com/elsie" id="link1">
    Elsie
   </a>
   ,
   <a class="sister" href="http://example.com/lacie" id="link2">
    Lacie
   </a>
   and
   <a class="sister" href="http://example.com/tillie" id="link3">
    Tillie
   </a>
   ;
and they lived at the bottom of a well.
  </p>
  <p class="story">
   ...
  </p>
 </body>
</html>
'''

相关文章

  • Python_Scrapy-第三方模块安装与使用

    第三方模块的安装 1、request库的安装与使用 requests库本质上就是模拟了我们用浏览器打开一个网页,发...

  • 入门(六)第三方模块

    Python社区提供了大量的第三方模块,使用方式与标准库类似 1、安装 (1)pip命令安装 (2)、使用PyCh...

  • 【融职教育】Web前端学习 第5章 node基础教程3 npm常

    一、npm安装第三方模块 npm有两种方式安装第三方模块:本地安装和全局安装,使用哪种安装方式,取决于我们用npm...

  • 2016.09.19 nodejs操作MongoDB数据库

    第三方模块库 www.npmjs.com 使用第三方模块mongoose 安装 实例 (1)插入数据 (2) 查询...

  • Apache模块

    DSO模块加载模块提供了灵活性。 模块的类型: 核心模块 标准模块 第三方模块 使用apxs编译安装模块 首先查看...

  • 模块和包

    模块和包 一、模块的分类 1,第三方模块 工具安装 源码安装 2,自定义模块 3,内置模块 模块除了 第三方模块,...

  • python 模块安装

      python模块的安装可以通过,下载源码手动安装,也可以通过第三方工具自动化安装。使用第三方工具,如pip,进...

  • Python开发环境使用:Pip第三方模块管理组件

    一、pip模块管理器的使用 Q:由于Python有几乎无限的第三方模块库,那我们如何安装和管理这些第三方模块呢? ...

  • Python连接数据库

    一、python连接oracle数据库 安装模块 使用第三方模块 cx_Oracle pip install cx...

  • 初识模块

    模块=库 分为标准库(不需要安装,直接可以用) 和第三方库 (需要安装在site-Packages) 使用模块还可...

网友评论

      本文标题:Python_Scrapy-第三方模块安装与使用

      本文链接:https://www.haomeiwen.com/subject/lmbadqtx.html