美文网首页
node爬虫最简单的demo

node爬虫最简单的demo

作者: 阿炸mm | 来源:发表于2019-09-29 12:06 被阅读0次

    1.安装node

    2.新建一个文件夹,文件夹里新建一个game.js

    3.安装模块

    在命令行输入安装模块命令:

    npm i

    npm install cheerio sync-request --save

    4.这里以taptap网站排行榜为例:taptap排行榜

    5.想爬这个排行榜的榜单名字,检查元素发现dom结构如下

    4.js文件代码如下

    var request = require('sync-request');//获取网页内容

    var cheerio = require('cheerio');//筛选网页内容

    url = 'https://www.taptap.com/top/download';//爬虫网站

    var html = '';

    html = request('GET', url).getBody().toString(); 

    var $ = cheerio.load(html);

    var gameName = $('.top-card-middle>a>h4').text();//获取游戏名称

    console.log(gameName); 

    5.然后在文件夹路径下运行node game.js,结果如下

    相关文章

      网友评论

          本文标题:node爬虫最简单的demo

          本文链接:https://www.haomeiwen.com/subject/ywhmuctx.html