美文网首页
NodeJS小说爬虫

NodeJS小说爬虫

作者: 灵魂放逐 | 来源:发表于2017-03-17 23:28 被阅读0次

  这是一个NodeJS爬虫项目,用于爬取爱去小说网的小说资源,非常适合新手学习NodeJS,感受NodeJS的魅力
经测试,爬取并合并1645章的斗破苍穹耗时约6min
  本项目使用的模快主要有:

  • async
  • cheerio
  • superagent
  • superagent-charset
  • mysql
  • bluebird
  • cron

async

异步流程控制模快,用于优化下载速度

cheerio

服务端的jQuery,替代繁琐的正则表达式,大大提高了开发效率

superagent

轻量级的http请求模快,高效灵活

superagent-charset

对superagent抓取页面进行转码,NodeJS平台gbk转utf8神器

mysql

NodeJS的MySQL驱动模快,我用它实现了一个非常简易的ORM

bluebird

API Promise化,便于使用async/await进行流程控制

cron

任务调度模快

项目地址见Github

相关文章

  • NodeJS小说爬虫

    这是一个NodeJS爬虫项目,用于爬取爱去小说网的小说资源,非常适合新手学习NodeJS,感受NodeJS的魅力经...

  • nodeJS爬虫(完整版)

    nodeJs爬虫

  • nodejs通过钉钉群机器人推送消息

    nodejs 通过钉钉群机器人推送消息 Intro 最近在用 nodejs 写爬虫,之前的 nodejs 爬虫代码...

  • NodeJs + Phantomjs 简易爬虫

    NodeJs + Phantomjs 简易爬虫 爬虫是什么? 引用百度百科的说法是: 如何在NodeJs上搭建爬虫...

  • Nodejs爬虫

    Node.js批量抓取高清妹子图片:https://cnodejs.org/topic/54bdaac4514ea...

  • NodeJS 爬虫

    技术栈cheerio: 将抓取的html直接转化为jquery对象,可以直接对获取信息进行DOM操作。puppet...

  • nodejs爬虫

    nodejs相关模块 获取网页内容(http\request\superagent等) 筛选网页信息(cheeri...

  • nodejs 爬虫

    爬取的是豆瓣网 本次将会用到两个库:superagent 和cheerio 其中 superagent是用来请求目...

  • nodejs - 爬虫

    继续上一篇写下爬虫的实现,网上找了一个爬虫的文章,然后从里面找了一个网址,https://www.lanvshen...

  • nodejs爬虫

    一、Puppeteer Puppeteer 提供了一系列的 API,可以在无 UI 的情况下调用 Chrome 的...

网友评论

      本文标题:NodeJS小说爬虫

      本文链接:https://www.haomeiwen.com/subject/dvgynttx.html