python爬虫的简单练习
抓取味多美蛋糕种类。
数量不多不需分页。
import urllib.request
import re
url="http://www.wdmcake.cn/category-1.html"
data=urllib.request.urlopen(url).read().decode("utf-8","ignore")
pat='target="_blank"><img src="(.?)" alt='
pat2='" alt="(.?)"/></a></div>'
imglist=re.compile(pat).findall(data)
txtlist=re.compile(pat2).findall(data)
for i in range(0,len(imglist)):
try :
thisimg=imglist[i]
txtname=txtlist[i]
thisimgurl=thisimg
localfile="pathcakePic/"+txtname+".jpg"
urllib.request.urlretrieve(thisimgurl,filename=localfile)
except Exception as err:
print("that's sad")
也就这样了~
网友评论