Python学习笔记(4)：爬取动态数据

Python学习笔记(4)：爬取动态数据

作者: 8907a9c3d98f | 来源:发表于2016-08-11 23:26 被阅读0次

我的代码

from bs4 import BeautifulSoup
import requests
import time
import urllib

url = 'https://knewone.com/discover?page='

def get_page(url,data=None):

    wb_data = requests.get(url)
    soup = BeautifulSoup(wb_data.text,'lxml')
    imgs = soup.select('a.cover-inner > img')

    download_links = []
    folder_path = '/Users/zhoujiangfeng/Pictures/jandan/'

    for img in imgs:
        img_link = img.get('src')
        download_links.append(img_link)

    for item in download_links:
        #使用urllib下载图片到本地
        urllib.request.urlretrieve(item,folder_path + item[-21:-16])
        print('done')

def get_more_pages(start,end):
    for one in range(start,end):
        get_page(url+str(one))
        time.sleep(2)


get_more_pages(1,10)

总结

注意图片链接的信息，需以图片格式后缀名保存（截取相应位数）
使用urllib库的方法下载图片到本地

相关文章

网友评论

本文标题：Python学习笔记(4)：爬取动态数据

本文链接：https://www.haomeiwen.com/subject/jtvssttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Python学习笔记(4)：爬取动态数据|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！