美文网首页
微博爬虫

微博爬虫

作者: lingmacker | 来源:发表于2019-07-29 20:53 被阅读0次

WeiBoSpider

  1. 简介

    一个基于 python3.6.8 和 splinter 的微博爬虫,可以爬取指定日期之间的微博信息,GitHub地址

  2. 使用

    • 前提,电脑以安装 Firefox 浏览器,系统为 windows;要想使用 Chrome,则只需要修改 WeiSpider 类中的 driver_path 为 "../driver/chromedriver.exe" 即可。
    • 在 requirements.txt 同级目录下,使用命令pip install -r requirements.txt安装项目依赖包。
    • 最后在 src 目录下之间使用 python weibo.py 即可运行项目,然后按照控制台输出信息进行操作即可。
    • 提示:在 weibo.py 的 main() 方法中,可以设置微博登录信息,用户名和密码,运行时可以自动填充,登录时只需手动输入验证码即可。
  3. 主要功能

    • 爬取微博指定时间范围内的数据。
    • 在爬取数据过程中,如果感觉爬取时间过长,可以按下 CTRL + C 结束爬取,已爬取的内容仍会被保存下来。只有使用 cmd 运行文件才可以实现。
    • 微博登录很多时候需要输入验证码,而引入图片识别成本太大,所以该爬虫加入了手动填写验证码的方式。
  4. 运行图片

    • cmd 运行实例


      weibospider1.png
    • 运行结果截图

      weibospider2.png

相关文章

  • 【工具】echarts+kuno+分词

    数据: python爬虫:微博爬虫、借助'出书啦'爬微信知乎Java爬虫:Java微博爬虫 时间轴: JAVA时间...

  • 微博爬虫

    WeiBoSpider 简介一个基于 python3.6.8 和 splinter 的微博爬虫,可以爬取指定日期...

  • 新浪微博爬虫

    layout: posttitle: 新浪微博爬虫categories: Spiderdescription: 微...

  • 如何采集新浪微博数据?

    本文主要介绍神箭手“新浪微博采集爬虫”(以下简称“微博爬虫”)的使用教程以及注意事项。 新浪微博中有大量高价值的软...

  • 微博爬虫-发布微博以及获取微博资料

    微博爬虫-发布微博以及获取微博资料 1.发布微博 为了减少限制我们使用移动版本登录首先登录微博,这里我采用cook...

  • python大牛一个小时爬去新浪微博千万数据是这样做到的

    爬虫功能: 此项目和QQ空间爬虫类似,主要爬取新浪微博用户的个人信息、微博信息、粉丝和关注(详细见此)。 代码获取...

  • 土地分类 微博爬虫 本地处理modis数据

  • 爬取老树画画全部微博数据:三千诗与画

    一、前言 1、项目介绍 本次用fiddler抓包移动端(ipad)微博,再用python爬虫获取老树画画微博几乎全...

  • 微博爬虫技术方案

    技术选型 目的:实现爬取相关微博的评论、转发、点赞等信息 方案:在网上搜索了一遍后,相对觉得python比较好用。...

  • 新浪微博爬虫代码

    整理一下文章 《[数据分析] 简书在微博上的分享情况》 的代码。 微博爬虫的难点: 登录问题之前我用了两种方式:1...

网友评论

      本文标题:微博爬虫

      本文链接:https://www.haomeiwen.com/subject/cxgirctx.html