美文网首页
requests-html校验页面链接可用性

requests-html校验页面链接可用性

作者: 阿尔卑斯_ | 来源:发表于2021-08-02 20:35 被阅读0次

1、安装requests-html

pip install requests-html

2、代码块


# 引入requests-html

import requests_html

# 获取页面

html= requests_html.HTMLSession().get('https://www.baidu.com')

# 获取页面全部的链接

url= html.html.absolute_links

# 遍历页面全部链接

for Url in url:

    # 判断url是不是一个链接
    if('https://' in Urlor 'http://' in Url):

            # 获取当前链接页面

             url= requests_html.HTMLSession().get(Url)

             if(url.ok):

                    # 页面可访问就跳过

                    continue

              else:

                    # 页面不能访问就把错误url打印出来

                    print("不能访问\t"+Url)

    else:

            print('不是链接'+Url)

注:(最好设置代理或者连上自己的热点)部分网页https://beian.miit.gov.cn校验不通过,换成自己的热点就能校验通过。

相关文章

  • requests-html校验页面链接可用性

    1、安装requests-html 2、代码块 注:(最好设置代理或者连上自己的热点)部分网页https://be...

  • 页面校验

    页面校验 金钱校验

  • requests-html请求需要render渲染时,mac自动

    在试着做页面爬虫的时候,使用到了requests-html爬虫框架时,其中当页面返回的内容只有.html地址时,需...

  • 前端国际化

    需要注意的点 1 .最基本的要求:文字替换.label,placeholder,字段校验提示信息,超链接2 .页面...

  • requests-html支持javascript渲染页面

    一、导入requests-html 模块 pip install requests-html 导入失败,根据报错原...

  • SpringMVC框架 -- 注解开发validation校验

    一.对于校验理解 项目中,通常使用较多是前端的校验在服务端校验:控制层conroller:校验页面请求的参数的合法...

  • requests-html

    requests-html是requests的升级版,出自同一个作者之手。 requests-html是对requ...

  • validation校验

    1 项目中,通常使用较多是前端的校验,比如页面中js校验。对于安全要求较高建议使用服务端校验。 2 服务端校验: ...

  • 注解开发validation校验

    一、校验理解 项目中,通常使用较多是前端的校验,比如页面中js校验。对于安全要求较高点建议在服务端进行校验。 服务...

  • SpringMVC 中的数据校验

    实际中,通常使用较多是前端的校验,比如页面中js校验,对于安全要求较高的建议在服务端也要进行校验。 服务端校验可以...

网友评论

      本文标题:requests-html校验页面链接可用性

      本文链接:https://www.haomeiwen.com/subject/nvbjvltx.html