美文网首页
百度贴吧爬虫node+vue+socket

百度贴吧爬虫node+vue+socket

作者: ArH | 来源:发表于2016-12-12 00:41 被阅读126次

baidu_tieba_crawler

演示地址

http://www.femirror.com/index
服务器很慢,请原谅

项目地址

https://github.com/tyaqing/baidu_tieba_crawler
喜欢的给个star

使用说明书

!!!爬虫类的东东还是友善使用

程序运行不起来就要检查下 以下接口是否替换

~ 代理的api接口 mongo地址 socket地址 ~

先说下目录结构

├─model              mongooes 模型  Scheme
│  ├─model.js        定义了数据库模型 
├─server             运行socket 和 api的服务端代码
│  ├─api.js          express路由生成的 restful api
│  ├─api_action.js   api.js 会调用我的函数 
│  ├─cp.js           socket.js会通过child_process调用我 我只运行在子进程里
├─fe                 vue-cli 生成的 Webpack 打包工具 便于调试。
│  │  ├─src          其他没什么好介绍的了

真·调试

node socket.js //运行restful api 和socket服务
cd fe && npm run dev   //运行调试模式

关于技术栈

用到的东西挺多的,但是都是用了点皮毛知识,提前踩坑。

前端的

vue大礼包(vue-resource vue-router vue-socket.id element-ui)

后端的

express socket.io superagent cheerio mongoose

数据库

mongo

相关文章

  • 百度贴吧爬虫node+vue+socket

    baidu_tieba_crawler 演示地址 http://www.femirror.com/index服务器...

  • 百度贴吧高级爬虫

    最近做了一个完整版的百度贴啊全吧爬虫,过程比较具有代表性,分析过来供大家参考。代码在解禁后后贴吧爬虫查看。 项目结...

  • 百度贴吧爬虫

    利用requests、正则表达式和Beautiful爬取贴吧用户名、评论和图片 定义工具类——去除爬取项多余内容 ...

  • Python3之百度贴吧小爬虫

    华为贴吧爬虫 程序爬了6000页就被百度封掉,你们回去可以改下贴吧的,比如爬小米吧或者其他娱乐的吧,将页面数改成小...

  • 30分钟!用python的request模块抓取百度贴吧内容

    001 我想通过自动抓取百度贴吧 “python爬虫吧“ 里的帖子数据,找到那些付费写爬虫的帖子,赚点零花钱!为了...

  • 多线程爬虫-BeautifulSoup

    线程基类 爬虫百度贴吧中某帖子图片 先要安装BeautifulSoup 参考 BeautifulSoup官网api

  • Python_Scrapy-基础实践

    爬虫实践 获取百度贴吧的内容 以滁州学院吧为例 贴吧地址: 链接的末尾处:&ie=utf-8 表示该连接采用的是u...

  • Python爬虫实战

    注:采转归档,自己学习查询使用 Python爬虫实战(1):爬取糗事百科段子Python爬虫实战(2):百度贴吧帖...

  • 贴吧帖子内图片抓取

    Python之爬虫练习 利用Python对百度贴吧进行网络爬虫,实现抓取每个帖子内的所有图片并将之保存到本地。 本...

  • 第四阶段 爬虫整理

    爬虫概述 爬虫案例 案例1:爬取百度贴吧数据 分析:GET方式爬取数据抓包:设计:实现: 案例2:抓妹子图 分析:...

网友评论

      本文标题:百度贴吧爬虫node+vue+socket

      本文链接:https://www.haomeiwen.com/subject/swkqkttx.html