1.我采集的是新浪博客的页面 新浪博客/s/articlelist_1765896480_0_1.html 新浪博客换成blog.sina.com.cn 方便演示。
2.在栏目选择你要采集的栏目


在博客分页列表要注意页面数据的变化要选择你需要采集的页面

3.然后就是要采集他的页面链接了

<div id="sina_keyword_ad_area2" class="articalContent newfont_family">
[!--newstext--]
</div>

4.然后就是正文标题和文章内容了

<title>[!--title--]</title>

<div id="sina_keyword_ad_area2" class="articalContent newfont_family">
[!--newstext--]
</div>
5.接下来就测试文章是否采集成功了
在采集审核中查看如果是空白说明采集失败,从我说的上面几点开始检查



网友评论