Python实战爬虫：练手爬虫用urllib模块获取

Python实战爬虫：练手爬虫用urllib模块获取

作者: 25岁学Python | 来源:发表于2019-12-24 22:15 被阅读0次

Python实战爬虫：练手爬虫用urllib模块获取
Java面试题：Python中爬虫框架或模块的区别
python网络爬虫基础模块安装
python学习笔记（二）——requests模块
Python基础知识全网最全6(网络爬虫)
Python爬虫入门（urllib+Beautifulsoup）
Python爬虫学习（十六）初窥Scrapy
爬虫请求模块
Python2.7爬虫-爬取简书文章-入门
Python网络爬虫（八） - 利用有道词典实现一个简单翻译程序

练手爬虫用urllib模块获取

import re
import urllib

def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

def getImg(html):
    reg = r'src="(.+?\.jpg)" pic_ext'
    imgre = re.compile(reg)
    imglist = re.findall(imgre,html)
    return imglist 

html = getHtml("https://zwk365.com") //攒外快网
print getImg(html)


推荐Python大牛在线分享技术 扣qun：855408893

领域：web开发，爬虫，数据分析，数据挖掘，人工智能

零基础到项目实战，7天学习上手做项目

修改后python3的代码

import re
import urllib.request

def getHtml(url):
    page = urllib.request.urlopen(url) #获取网站
    html = page.read() #内容读取,返回的html是字节的格式
    return html

def getImg(html):
    # print(str(html,encoding='utf8'))   #内容以爬下来为准而不是网站上的
    reg = 'data-original="(.*?)"'  #设置下内容的re格式
    imglist = re.findall(reg,str(html,encoding='utf8'),re.S)
    return imglist

html = getHtml("https://zwk365.com")
print(getImg(html))

相关文章

Python实战爬虫：练手爬虫用urllib模块获取
练手爬虫用urllib模块获取修改后python3的代码
Java面试题：Python中爬虫框架或模块的区别
**(1)爬虫框架或模块** Python自带爬虫模块：urllib、urllib2 ; 第三方爬虫模块：requ...
python网络爬虫基础模块安装
python网络爬虫基础模块安装 python的网络爬虫一般需要requests模块，urllib，urllib2...
python学习笔记（二）——requests模块
python的requests模块是爬虫的基本模块，让我们看看怎么用！参考：Python3 网络爬虫开发实战介绍...
Python基础知识全网最全6(网络爬虫)
六、网络爬虫 1. python如何访问互联网 (1).urllib模块: 实战1: 下载图片download...
Python爬虫入门（urllib+Beautifulsoup）
Python爬虫入门（urllib+Beautifulsoup）本文包括：1、爬虫简单介绍2、爬虫架构三大模块3...
Python爬虫学习（十六）初窥Scrapy
Python爬虫学习（一）概述Python爬虫学习（二）urllib基础使用Python爬虫学习（三）urllib...
爬虫请求模块
爬虫请求模块版本 python2：urllib2、urllib 常用方法向网站发起一个请求并获取响应重构Us...
Python2.7爬虫-爬取简书文章-入门
参考原文： python开发简单爬虫Python爬虫实战Firefox抓包分析分为五个模块：主模块、URL管理器...
Python网络爬虫（八） - 利用有道词典实现一个简单翻译程序
目录： Python网络爬虫（一）- 入门基础Python网络爬虫（二）- urllib爬虫案例Python网络爬...

网友评论

本文标题：Python实战爬虫：练手爬虫用urllib模块获取

本文链接：https://www.haomeiwen.com/subject/ukhinctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Python实战爬虫：练手爬虫用urllib模块获取|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！