美文网首页
nodeJS 实现一个爬虫(爬取文本、图片)

nodeJS 实现一个爬虫(爬取文本、图片)

作者: 思成90 | 来源:发表于2016-12-15 21:28 被阅读0次

<最终爬取全部的图片全部放在了本地的images中

/** * Created by wusicheng on 2016/12/15. /
var fs = require("fs");
var request = require("request");
var cheerio = require("cheerio");
var mkdirp = require('mkdirp');
var http= require("http");
//目标网址
var url ='http://jandan.net/ooxx';
//本地存储目录
var dir = './images';
//创建目录
mkdirp(dir, function(err) { if(err){ console.log(err); }});
//发送请求
request(url, function(error, response, body) { if(!error && response.statusCode == 200) { var $ = cheerio.load(body); console.log(1)
//找到img所在标签目录
var images = $('.text p');
console.log(images)
images.each(function(item) {
// 通过标签名找到img
var img = $(this).find('img')
var src = img.attr('src') + "";
console.log(src);
console.log('正在下载' + src);
download(src, dir, Math.floor(Math.random()
100000) + src.substr(-4,4)); console.log('下载完成'); }); }});
//下载方法
var download = function(url, dir, filename){ request.head(url, function(err, res, body){ request(url).pipe(fs.createWriteStream(dir + "/" + filename)); });};

相关文章

网友评论

      本文标题:nodeJS 实现一个爬虫(爬取文本、图片)

      本文链接:https://www.haomeiwen.com/subject/kxigmttx.html