Python爬虫-爬取网站图片

作者: Fitz916 | 来源:发表于2017-08-12 12:42 被阅读284次

3个适合新人上手的Python项目
各类链接
爬虫很难？最适合新人上手的3个Python项目,即学即用！
3 个适合新人上手的Python项目
Python学习
python-爬虫学习（文字、图片、视频）
python爬虫学习（文字、图片、视频）
Python爬虫-爬取网站图片
python爬虫爬取英雄联盟英雄图片
python爬虫爬取王者荣耀英雄列表图片

今天要爬的网站就是

http://www.4j4j.cn/beauty/index.html

进入网站，点开美女图片栏目，打开开发者工具找到我们需要的url，跳转到详情页的url
接下来我们随便点进一个里面，比如第二个美女，进去可以看到她的更多

image.png

可以看到我们想要的图片url，我们只要取到url，然后requests.get(url)就可以把图片下载下来将图片保存到我们的磁盘里

            with open('girl_%d.jpg' % i, 'wb') as fp:
                fp.write(res.content)

这个爬虫也很简单，就不多说了，主要用requests和BeautifulSoup
最后附上完整代码

#!/usr/bin/env python3
# -*- coding:utf-8 -*-

import requests
import os
from bs4 import BeautifulSoup

base_url = 'http://www.4j4j.cn'
index_url = 'http://www.4j4j.cn/beauty/index.html'

# 获取每个美女详情页的url
def get_url_list():
    response = requests.get(index_url)
    response.encoding = 'utf-8'
    html = BeautifulSoup(response.text, 'html.parser')
    data = html.find('div', {'class': 'beautiful_pictures_show'}).find_all('span')
    result = [(item.find('a')['href'], item.find('a').get_text()) for item in data]
    return result

# 下载图片保存到本地
def get_img(beauty_url, title):
    save_path = '/Users/mocokoo/Documents/py_file/%s' % title
    os.mkdir(save_path)
    os.chdir(save_path)
    response = requests.get(beauty_url)
    response.encoding = 'utf-8'
    html = BeautifulSoup(response.text, 'html.parser')
    data = html.find('div', {'class': 'beauty_details_imgs_box'})
    girls = data.find_all('img')
    i = 1
    for girl in girls:
        girl_url = girl['src']
        res = requests.get(girl_url)
        res.encoding = 'utf-8'
        if res.status_code == 200:
            with open('girl_%d.jpg' % i, 'wb') as fp:
                fp.write(res.content)
                i += 1


def get_page():
    url_list = get_url_list()
    for url in url_list:
        beauty_url = base_url+url[0]
        title = url[1]
        get_img(beauty_url=beauty_url, title=title)

if __name__ == '__main__':
    get_page()

3个适合新人上手的Python项目
人生苦短，我用Python！废话不多说，今天给大家分享三个极实用的Python爬虫案例。爬取网站美图爬取图片...
各类链接
爬虫使用python-aiohttp爬取今日头条【Python】爬虫爬取各大网站新闻 Scrapy 模拟登录新...
爬虫很难？最适合新人上手的3个Python项目,即学即用！
今天给大家分享三个极实用的Python爬虫案例。 1、爬取网站美图爬取图片是最常见的爬虫入门项目，不复杂却能很好...
3 个适合新人上手的Python项目
今天给大家分享三个极实用的Python爬虫案例。 1、爬取网站美图爬取图片是最常见的爬虫入门项目，不复杂却能很好...
Python学习
python爬虫(六) python爬取图片素材通过爬虫爬取图片的地址以及电影的名称，然后将图片素材命名为电影名...
python-爬虫学习（文字、图片、视频）
爬虫-文字爬取爬虫-图片爬取爬虫-视频爬取
python爬虫学习（文字、图片、视频）
爬虫-文字爬取爬虫-图片爬取爬虫-视频爬取
Python爬虫-爬取网站图片
今天要爬的网站就是进入网站，点开美女图片栏目，打开开发者工具找到我们需要的url，跳转到详情页的url接下来我们...
python爬虫爬取英雄联盟英雄图片
python爬虫爬取英雄联盟英雄图片 python爬取数据四步走1、确定目标2、分析目标3、编写代码4、执行爬虫 ...
python爬虫爬取王者荣耀英雄列表图片
python爬虫爬取王者荣耀英雄图片 python爬取数据四步走1、确定目标2、分析目标3、编写代码4、执行爬虫 ...

Python爬虫-爬取网站图片

相关文章

3个适合新人上手的Python项目

各类链接

爬虫很难？最适合新人上手的3个Python项目,即学即用！

3 个适合新人上手的Python项目

Python学习

python-爬虫学习（文字、图片、视频）

python爬虫学习（文字、图片、视频）

Python爬虫-爬取网站图片

python爬虫爬取英雄联盟英雄图片

python爬虫爬取王者荣耀英雄列表图片

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

Python 开发

python爬虫实战

Python

python自学

python爬虫

Python3自学爬虫实战

Python语言与信息数据获取和机器学习