from urllib.request import Request, urlopen
from urllib.parse import quote
#将ut-8转义成字符模式
url = "https://www.baidu.com/s?ie=UTF-8&wd={}".format(quote("尚学堂"))
#创建标头字典
header = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.87 Safari/537.36"
}
#创建request对象
request = Request(url,headers=header)
#打开编译好的网址
resp = urlopen(request)
#输入爬去的网页内容
print(resp.read())
总结:代码多练习就回来,格式基本都是统一的,想一切办法骗过服务器获取信息就行。把各种元素都写活。
网友评论