爬取网站信息实例1

作者: 闲云野鹤_23dd | 来源:发表于2021-10-15 21:02 被阅读0次

1、爬取京东华为手机信息请求：
import requests
url='https://pro.jd.com/mall/active/3QxGBykRhcABgSuQo5yJ6sxVogMb/index.html'
def jingdong():
try:
r = requests.get(url, timeout=30)
r.raise_for_status() # 如果状态不是200，引发HTTPError异常
r.encoding = r.apparent_encoding # 根据响应内容指定编码格式utf-8
print(r.text[:1000])
except:
return '爬取失败'
print(r.request.headers)

image.png
2、修改请求头模拟浏览器爬取亚马逊商品信息：
def yamaxun():
kv={'user-agent':'Mozilla/5.0'}#模拟浏览器爬取网站信息
url='https://www.amazon.cn/gp/product/B08MF6GCHN'
try:
r = requests.get(url, headers=kv)#修改请求头信息
r.raise_for_status() # 如果状态不是200，引发HTTPError异常
r.encoding = r.apparent_encoding # 根据响应内容指定编码格式utf-8
print(r.text[:1000])
except:
return '爬取失败'
print(r.request.headers,r.status_code,r.text)

image.png

3、爬取百度搜索关键字信息代码示例:

image.png

import requests
def getHTMLText(url):
kv={'wd':'Python'}#定义关键字信息
try:
r=requests.get(url,params=kv,timeout=30)
r.raise_for_status()#如果状态不是200，引发HTTPError异常
r.encoding=r.apparent_encoding#根据响应内容指定编码格式utf-8
print(r.url,r.status_code)
#return r.text
except:
return '爬取失败'
if name == 'main':
url='https://www.baidu.com'
print(getHTMLText(url))

image.png

网友评论

本文标题：爬取网站信息实例1

本文链接：https://www.haomeiwen.com/subject/brrncltx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

爬取网站信息实例1

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读