Node.JS开发爬虫工具爬取某电影下载网站

作者: 缺月楼 | 来源:发表于2020-04-09 23:03 被阅读0次

Node.JS开发爬虫工具爬取某电影下载网站
「完结篇」网络爬虫+实时监控+推送微信
Python新手写爬虫！尝试动态加载的电影网站爬虫
python爬取某网站电影下载地址
Python 学习——每天写点小东西-6
PW05格言网的数据采集
Selenium小例子
Python爬虫之Scrapy框架爬取XXXFM音频文件
各类链接
「爬虫」从某网站爬取数据

node.js爬取某电影下载网站小项目

本项目采用以下几个node库

require请求库
类似http(请注意目前此库已经不更新)
iconv-lite JS转换库
对请求的文件格式进行转码


var iconv = require('iconv-lite');
//转码
const bufs = iconv.decode(body, 'gb2312');
const html = bufs.toString('utf8');

cheerio 服务端请求库 服务端请求库类似于jquery 本项主要的爬虫库


//获取数据
const cheerio = require('cheerio');
const url = '/html/gndy/oumei/list_7_2.html';
const host = 'https://www.ygdy8.net';
//最后封装一下 请求目标网页上所有页数 采用异步方式 获取每一个单页面
const getList = async (url) => {
  const html = await requestPromise(url);
  const $ = cheerio.load(html);
//查找需要的内容 逐一分解
  $('.co_content8 ul table tbody tr:nth-child(2) td:nth-child(2) b a:nth-child(2)').each((i, item) => {
    getMovieDetail($(item).attr('href'));
  });
};

fs node.js保存数据模块

const fs = require('fs');
//文件保存
  fs.appendFile('./public/index.js', JSON.stringify(movie), function () {
    console.log('执行完成');
  });
  console.log(movie);
};