#导入库
import requests
from fake_useragent import UserAgent
from lxml import etree
#创建url
url = "http://www.shuhai.com/top/"
#创建标头
headers = {
"UserAgent": UserAgent().chrome
}
#请求
response = requests.get(url, headers=headers)
#响应 获取页面信息
e = etree.HTML(response.text)
#通过xpath获取指定信息的内容
names = e.xpath(
"//div[@class='book-item noborder']//div[@class='flex']//a[contains(@href,'http://www.shuhai.com/book/')]/text()")
#把names转成len格式,再迭代names里的内容和数量
for num in range(len(names)):
print(num+1,":", names[num])
总结:xpath 在之前 selenium里学习过,所以很容易上手,前面几个就暂时不学习了。
最后导出后还不会创建文件保存起来。
网友评论