美文网首页
nodeJS 实现一个爬虫(爬取文本、图片)

nodeJS 实现一个爬虫(爬取文本、图片)

作者: 思成90 | 来源:发表于2016-12-15 21:28 被阅读0次

    <最终爬取全部的图片全部放在了本地的images中

    /** * Created by wusicheng on 2016/12/15. /
    var fs = require("fs");
    var request = require("request");
    var cheerio = require("cheerio");
    var mkdirp = require('mkdirp');
    var http= require("http");
    //目标网址
    var url ='http://jandan.net/ooxx';
    //本地存储目录
    var dir = './images';
    //创建目录
    mkdirp(dir, function(err) { if(err){ console.log(err); }});
    //发送请求
    request(url, function(error, response, body) { if(!error && response.statusCode == 200) { var $ = cheerio.load(body); console.log(1)
    //找到img所在标签目录
    var images = $('.text p');
    console.log(images)
    images.each(function(item) {
    // 通过标签名找到img
    var img = $(this).find('img')
    var src = img.attr('src') + "";
    console.log(src);
    console.log('正在下载' + src);
    download(src, dir, Math.floor(Math.random()
    100000) + src.substr(-4,4)); console.log('下载完成'); }); }});
    //下载方法
    var download = function(url, dir, filename){ request.head(url, function(err, res, body){ request(url).pipe(fs.createWriteStream(dir + "/" + filename)); });};

    相关文章

      网友评论

          本文标题:nodeJS 实现一个爬虫(爬取文本、图片)

          本文链接:https://www.haomeiwen.com/subject/kxigmttx.html