美文网首页
node爬虫,学习一下

node爬虫,学习一下

作者: 轻颜Lee | 来源:发表于2017-05-08 12:00 被阅读49次

    学习原作者的文章http://www.jianshu.com/p/7eb6a0b9e8a4
    dom节点变更,所以改了一下,自己记录下

    Paste_Image.png

    还有记得要 **npm install cheerio **一下,要不然报“Cannot find module 'cheerio'”

    var url = 'http://www.jianshu.com/u/53fb509bd05c';

    <pre>
    function filterChapter(html) {
    var $ = cheerio.load(html);
    var articleList = $('.note-list').children('li');
    // 创建一个空数组,用来装载我们的文章对象
    var articlesData = [];
    articleList.each(function(item) {
    // 以下 JQ 的方法,相信会一点 JQ 的人都能看懂啦,哈
    var article = $(this);
    var title = article.find('div').find('.title').text();
    var span = article.find('div').find('.meta').find('a').eq(0).text();
    var loveCount = article.find('div').find('.meta').find('span').eq(0).text();
    // .eq(i) 通过索引筛选匹配的元素。使用.eq(-i)就从最后一个元素向前数。
    // 创建文章对象,JS 的对象确实跟 json 的很像呀
    var articleData = {
    title: title,
    love: loveCount.toString().trim(),
    readCount: span.toString().trim()
    };
    articlesData.push(articleData);
    });
    return articlesData;
    }
    </pre>
    ps:还不会用这个简书,顺便发一下第一个文章试试效果

    相关文章

      网友评论

          本文标题:node爬虫,学习一下

          本文链接:https://www.haomeiwen.com/subject/pvemtxtx.html