美文网首页
【week1】day4:爬取霉霉图片

【week1】day4:爬取霉霉图片

作者: 霍淇三公子 | 来源:发表于2016-09-06 21:40 被阅读0次

1,基础知识

  • 获取网页中的动态数据

2, 自己动手写程序

  • The code

from bs4 import BeautifulSoup
import requests, urllib, time

#proxies = {"http": "http://139.162.8.118"}

proxy_support = urllib.request.ProxyHandler({'http': '127.0.0.1:8787'})
opener = urllib.request.build_opener(proxy_support)
urllib.request.install_opener(opener)

def get_page(url, page, data = None):
    wb_data = requests.get(url)
    soup = BeautifulSoup(wb_data.text, 'lxml')

    imgs = soup.select('img.entry-thumbnail')

    if data == None:
        for i in range(len(imgs)):
            img_link = imgs[i]
            img = img_link.get('src')
            str_num = str(i)
            print(img)
            #download(img, str_num)

            pic = urllib.request.urlopen(img)
            name = '/Users/aipengya/Downloads/pictures_test/' + '(' + str(page) + ')' + str_num + '.jpg'
            f = open(name, 'wb')
            f.write(pic.read())
            f.close()

    print("Done!")

def get_more_pages(start, end):
    for page in range(start, end):
        url = 'http://weheartit.com/inspirations/taylorswift?scrolling=true&page={}'.format(page)
        get_page(url, page)
        time.sleep(2)


#def download(img, str_num):
#   file_name = path + str_num + '.jpg'
#   img_data = urllib.request.urlopen(img).read()
#   f = open(file_name, 'wb').write(img_data)
#   f.close()

get_more_pages(1, 3)

#main-container > div > div > div > div > div > a > img

3, 反思与总结

  • 代码中也要设代理,虽然目前还不清楚代理应该怎么设。

相关文章

  • 【week1】day4:爬取霉霉图片

    1,基础知识 获取网页中的动态数据 2, 自己动手写程序 The code 3, 反思与总结 代码中也要设代理,虽...

  • Python 实战:week1 爬取霉霉图片

    运行效果: 作业代码: 项目代码 小结 异步加载 通过 JS 实现动态加载数据,在与当前 HTML 页面的加载并不...

  • Python实战计划学习笔记:week1_4 爬取霉霉照片

    学习爬虫第3天,爬取霉霉照片。代码如下: 获取图片如下: 单独照片: 总结: 1.更加熟练的调用函数来2.添加he...

  • 在网易LOFTER爬美眉照片

    第一大规模的爬取网站多页的照片,本来想爬weheartit.com上霉霉的图片的,发现根本上不了那网,上了代理都打...

  • python实战计划:批量下载图片_爬取霉霉照片

    Date:2016-9-25update:20160926By:Black Crow 前言: 本期的批量下载功能,...

  • 霉霉

    画的不是很好,见谅

  • 霉霉

    满墙的海报,Red, Fearless,Speak Now, Safe & Sound… 原木大柜里层层叠叠的专辑...

  • 霉霉

    谨以此文,记以28岁的泰勒斯威夫特。 一. 那是1989年。 洛杉矶大地震。 一个大眼睛的小女孩出生了,她躺...

  • 霉霉——《LOVER》

    翻看绘图本,应该有很久没画人像素描了,今天看到霉霉新专辑宣传画,发色如彩虹,简直美呆。 画了张素描,手的确生了许多。

  • 霉霉老师…?

    今天发现了个大事 帕仔和金仔这么帅配音演员也肯定很帅(doge

网友评论

      本文标题:【week1】day4:爬取霉霉图片

      本文链接:https://www.haomeiwen.com/subject/rzzdettx.html