var cheerio = require( 'cheerio' )
- 抓取img src
var $ = cheerio.load( url || html );
$(img[.chass || #id]).each(function() {
console.log($(this).attr('src'));
})
- 爬取div内的信息
以网易云音乐--歌单相关的html为例
<div class="u-cover u-cover-1">
<img class="j-flag" src="http://p1.music.126.net/8xqfI5kkh7MKms9OABc0sw==/1099
51162897127854.jpg?param=140y140"/>
<a title="时间治愈的是 愿意自渡之人" href="/playlist?id=652762973" class="msk"></a>
<div class="bottom">
<a class="icon-play f-fr" title="播放" href="javascript:;" data-res-type="13" data-res-
id="652762973" data-res-action="play"></a>
<span class="icon-headset"></span>
<span class="nb">57635</span>
</div>
</div>
爬虫程序:
var $ = cheerio.load( url || html );
var caption = $(div.ul-cover-l])
var itemList = [];
caption.each(function() {
var cap = $(this);
var item = {
src: cap.find('img.j-flag').attr('src'),//图片路径
title: cap.find('a.msk').attr('title'),//歌单名称
id: cap.find('a.f-fr').attr('data-res-id'),//歌单id
type: cap.find('a.f-fr').attr('data-res-type'),//歌单种类
nb: cap.find('span.nb').text(),//歌单播放量
creater: cap.find('a.s-fc3').text(),//歌单发行者
byhref: cap.find('a.s-fc3').attr('href')//发行者地址
};
itemList.push(item);
})
console.log(itemList)
网友评论