美文网首页
04_简单的爬虫cheerio基于node.js

04_简单的爬虫cheerio基于node.js

作者: pzmpzm | 来源:发表于2017-11-24 21:17 被阅读0次

    基于node.js

    1、 先去安装 cheerio模块

    2、且要获取http 或者 https

    3、var url = "http//:www.news/baidu.com"

    4、通过 http.get()去获取

    http.get(url,function(response){

    // 4.1开始爬数据

    var str =""; //(存储数据)

    response.on("data",function(chunk){

    str+=chunk;

    })

    //4.2、结束

    response.on("end",function(){

    // 为实例化渲染数据 cheerio

    // decodeEntities:false  解码

    var $ = cheerio.load(str, decodeEntities:false);

    var arr = []; //真的数据

    //(ul li)去查看你要想数据的class或者id名,用法同jq

    $("ul li ").each(function(){

    arr.push({

    title:$(this).find('.gname').html(),

    img:$(this).find('a').html(),

    xj: $(this).find(".xj b").html(),

    yj:$(this).find(".yj em").html()

    });

    })

    console.log(arr); //打印出自己的

    可以在这里去写 在mongoDB插入数据的代码第四步4

    就可以把爬到的数据放到数据库之中

    })

    })

    文章同步上一片

    相关文章

      网友评论

          本文标题:04_简单的爬虫cheerio基于node.js

          本文链接:https://www.haomeiwen.com/subject/ujtqbxtx.html