美文网首页
Node完成简单爬虫

Node完成简单爬虫

作者: 页面仔小杨 | 来源:发表于2019-01-24 15:32 被阅读0次

    编写好node代码,终端运行node app.js后

    页面显示json数据

    [    

        {   "title":"【活动+视频】北京1月12日Node Party活动",        "href":"/topic/5c1760337ec239239ff579a2"  }, 

        {   "title":"送几本《Node.js开发实战》",        "href":"/topic/5c2edce13898674067a7b103"   }

    ]

    首先介绍两个库

    superagent 是个 http 方面的库,可以发起 get 或 post 请求

    cheerio 一个 Node.js 版的 jquery,用来从网页中以 css selector 取数据,使用方式跟 jquery 一样的

    开始写我们的爬虫

    1.新建一个文件夹lesson,进去之后 npm init

    $ mkdir lesson

    $ cd lesson 

    $ npm init

    2.安装node依赖包

    $ npm i --save express superagent cheerio

    3.编写爬虫代码

    4.终端运行

    node app.js

    进阶:输出包括主题的作者

    需要重新查看页面的元素哦,附上代码仅供参考

    相关文章

      网友评论

          本文标题:Node完成简单爬虫

          本文链接:https://www.haomeiwen.com/subject/jdayjqtx.html