第一个小爬虫代码

作者: 姽婳之语 | 来源:发表于2018-09-09 23:41 被阅读0次

第一个小爬虫代码
scrapy爬虫实践 --- day one
Scrapy 爬虫的基本使用
python爬虫小项目
scrapy自定义Pipline
用PyCharm Profile分析异步爬虫效率
python各类爬虫案例，爬到你手软！
python各类爬虫案例，爬到你手软！
Pycharm+Scrapy框架运行爬虫糗事百科（无items数
从国家统计局爬取省市区信息

# -*- coding: utf-8 -*-
import urllib
from bs4 import BeautifulSoup
from urllib import parse

url = 'https://www.douban.com/tag/{}/?focus=book'.format(parse.quote('小说'))
res = urllib.request.urlopen(url)
soup = BeautifulSoup(res,"html.parser")
book_div = soup.find(attrs={"id":"book"})
book_a = book_div.findAll(attrs={"class":"title"})
for book in book_a:
    print(book.string)
    

import requests
from lxml import etree

res = requests.get(url)
root = etree.HTML(res.content)
book_a = root.xpath("//*[@id = 'book']//*[@class = 'title']/text()")
print(book_a)

分别用urllib+beautifulsoup和request+xpath方法爬取和解析网页内容

第一个小爬虫代码
分别用urllib+beautifulsoup和request+xpath方法爬取和解析网页内容
scrapy爬虫实践 --- day one
第一个爬虫项目该项目的源代码见: GitHub - scrapy/quotesbot: This is a sa...
Scrapy 爬虫的基本使用
1 Scrapy爬虫的第一个实例产生步骤(1)应用 Scrapy 爬虫框架主要是编写配置型代码步骤1∶建立一个 ...
python爬虫小项目
第一个爬虫小程序，从网络上学习的。实现了给定链接，爬取上面的图片代码如上，需要注意的是：1.AttributeE...
scrapy自定义Pipline
第一个事mysql 同步Pipline，适用爬虫量小异步mysql 的pipline, 适用爬虫量大。自定义...
用PyCharm Profile分析异步爬虫效率
第一个代码如下，就是一个普通的 for 循环爬虫。这段代码跑完花了37s，然后我们用 pycharm 的 pro...
python各类爬虫案例，爬到你手软！
小编整理了一些爬虫的案例，代码都整理出来了~ 先来看看有哪些项目呢： python爬虫小工具（文件下载助手）爬虫...
python各类爬虫案例，爬到你手软！
小编整理了一些爬虫的案例，代码都整理出来了~ 先来看看有哪些项目呢： python爬虫小工具（文件下载助手）爬虫...
Pycharm+Scrapy框架运行爬虫糗事百科（无items数
scrapy爬虫框架 qsbk.py 爬虫代码 import scrapy'''scrapy框架爬虫流程：发送请求...
从国家统计局爬取省市区信息
Location HttpUtil 爬虫代码