使用python2.7进行爬取网站图片。
看代码:
#coding=utf-8
import urllib2
import re
import os
url=raw_input(unicode("请输入图片url地址:","utf-8").encode("gbk"))
#url="http://www.umei.cc/"
def get_img(url):
response=urllib2.urlopen(url)
html=response.read()
pattern = re.compile(r'src="(.*?\.jpg)"')
#正则匹配
img_url=pattern.findall(html)
for x in range(1,len(img_url)):
print(img_url[x])
img=open('image//'+str(x)+'.jpg','wb')
response=urllib2.urlopen(img_url[x],timeout=5)
imghtml=response.read()
img.write(imghtml)
img.close()
if os.path.exists(os.getcwd()+'\\image'):
print(u"image文件夹已存在")
t_img(url)
else:
os.mkdir('image')
print(u"image文件夹创建成功")
get_img(url)
代码示意图
imgspider.py success
网友评论