美文网首页
python+fastapi自建HTTP爬虫IP池

python+fastapi自建HTTP爬虫IP池

作者: 就是很无聊 | 来源:发表于2020-11-27 14:13 被阅读0次

    使用的库

    • bs4
    • requests
    • pymongo
    • fastapi
    • uvicorn

    爬取ip

    网络上搜索一下有很多提供HTTP代理的网站,直接使用BeautifulSoup将IP爬下来。

    html =requests.get(url).text
    bs =BeautifulSoup(html,'html.perser')
    #findAll()
    #select()
    
    

    验证ip

    res = requests.get(url,headers=headers,proxies=proxies)
    #判断res.status_code是否等于200
    #db.insert_one()
    

    如果验证成功写入数据库。

    接口

    使用fastapi

    @app.get('/api')
    def api():
        data = 查询数据库随机返回一条
        return data
    

    效果展示

    https://998ip.com
    https://www.ipzdc.com

    演示地址:找IP

    相关文章

      网友评论

          本文标题:python+fastapi自建HTTP爬虫IP池

          本文链接:https://www.haomeiwen.com/subject/aysxwktx.html