看图说话。附带源码。
感兴趣的可以拷过去,然后修改“print(alt +" : " + url)”, 想干什么干什么。。(●>∀<●)
程序截图import urllib.request# 用于发送http请求,获取网页信息
from bs4import BeautifulSoup# 用于解析网页
import time# 用于控制访问速度
# 1、获取网页,分析想获取的数据规则
# 2、通过如上规则,使用BeautifulSoup批量获取
# 3、通过如上规则,遍历整个网站的每一个页面
urlPreFix ="https://www.sex.com/"
targetUrl = urlPreFix
# 用于提取资源目标url
def geturls(target):
target = BeautifulSoup(target, 'html.parser')
for imgin target.find_all('img', src='/images/t.png'):
alt = img.attrs['alt']
url = img.attrs['data-src']
print(alt +" : " + url)
counter =1
while counter <57:
print('当前执行URL:' + targetUrl)
html = urllib.request.urlopen(targetUrl)
geturls(html)
counter +=1
targetUrl = urlPreFix +"/?page=" +str(counter)
print('休眠5秒...')
time.sleep(5)
网友评论