爱站网关键字挖掘爬虫开发教程-采集关键词、长尾词数量、收录数和优

爱站网关键字挖掘爬虫开发教程-采集关键词、长尾词数量、收录数和优

作者: 98405539a93c | 来源:发表于2018-02-12 10:27 被阅读182次

爱站网关键字挖掘爬虫开发教程-采集关键词、长尾词数量、收录数和优
酒店搜索引擎优化三部曲
如何挖掘长尾关键词？揭秘长尾关键词挖掘不愿公开的秘籍
长尾关键词如何布局才能达到最优化的效果
如何批量整理一个行业3000个关键词？
如何快速准确挖掘优质长尾关键词？
什么是长尾理论？什么是长尾关键词？长尾词是什么意思？
如何搜索关键词？
如何布局长尾关键词
关于网站长尾关键词的挖掘和优化

本文主要介绍在神箭手上开发“爱站网关键字挖掘采集爬虫”的过程，爬虫主要实现批量输入关键字并爬取数据的功能，选择性登录功能（登录后爬取的数据更多），爬取字段包括长尾词数量、收录数和优化难度等字段。

爱站网是一个站长们经常使用的工具，是因为其具有长尾关键词挖掘的功能，做SEO的童鞋们都知道它的价值，而且对网站内容生产方向、结构规划，TDK编写都十分有帮助。

采集网站URL：https://ci.aizhan.com

使用功能点：

· 自定义设置

· initCrawl、beforeCrawl、onProcessContentPage和afterExtractField回调函数

下面，给你详细说明“爱站网关键字挖掘采集爬虫”在神箭手上的开发过程：

步骤1 创建爬虫

注册并登录神箭手，进入神箭手控制台。

点击“新建应用”，选择“爬虫”，点击“下一步”。

输入爬虫名称“爱站网关键字挖掘采集爬虫”，选择“编辑模式”，点击“创建”，神箭手爬虫创建成功。

步骤2 分析网页&开发爬虫

要在神箭手上开发爬虫，首先需要分析目标网站，本文使用Chrome浏览器分析爱站网关键字挖掘网页，按“F12”可以打开浏览器“开发者工具”。

1.“不登录”情况分析

不登录的话，一个关键字只能爬取最多100条数据。输入“旅游”并点击“查询”，网页加载完成后，是不是发现网页url变成了这个“https://ci.aizhan.com/65c56e38/”。

是不是很纳闷，怎么关键字变成一堆数字了？

其实，这是爱站网给你下的绊子，给关键字做了一次处理，不过这点困难阻挡不了我们前进的脚步。右击鼠标，查看“网页源码”，找到encode_unicode_param函数，关键字就是通过此函数进行处理的。

但函数源码并不在此，需要回到查询后的网页，按“F5”刷新网页，在浏览器“开发者工具”中选择“Sources”，找到“script.js?v=0108”文件，就能找到encode_unicode_param函数源码了，这样一来就可以顺利拼出关键词查询链接了，然后你就可以在神箭手爬虫编辑页开发非登录爬虫了。

2.“登录”情况分析

登录后，可爬取多页数据，打开爱站网登录页。

按“F12”打开浏览器“开发者工具”选择“Network”，勾选“Preserve Log”，输入“用户名、密码和验证码”，点击“登录”，分析发送的POST请求即可，并使用神箭手提供的solveCaptcha函数实现验证码识别逻辑。

注意：文章结尾有爱站网登录的代码片段。

最后，结合“神箭手开发文档”，在神箭手爬虫编辑页开发爬虫即可。

步骤3 测试并运行爬虫

爬虫开发完成后，点击“测试”按钮，检查爬虫的爬取结果是否正确。

测试通过后，进入“爬虫设置”页，设置“代理IP”、“文件云托管”，输入需要爬取的关键字，最后点“保存”。

返回爬虫总览页，点击“启动爬虫”，稍等片刻，爬虫就会爬到数据了。如果嫌弃爬虫的爬取速度，要么增加节点，要么优化爬虫代码。

步骤4 数据发布与导出

爬虫爬到数据后，可以选择将数据“发布到网站或数据库”中，点此查看神箭手数据发布详细教程。

此外，还可选择将数据“导出”，点此查看神箭手数据导出详细教程。

神箭手上开发的“爱站网关键字挖掘采集爬虫”导出数据示例，如下图所示：

爱站网登录代码片段：

//登录链接

var loginUrl = "https://www.aizhan.com/login.php";

//登录时发送的POST请求参数

var options = {

method: "POST",

data: {

refer: "https://ci.aizhan.com/",

username: username,//用户名

password: password,//密码

code: code//验证码

}

};

//发送登录请求

site.requestUrl(loginUrl, options);

//判断是否登录成功

if (site.getCookie("userSecure")) {

console.log("登录成功！");

return true;

}

相关文章

爱站网关键字挖掘爬虫开发教程-采集关键词、长尾词数量、收录数和优
本文主要介绍在神箭手上开发“爱站网关键字挖掘采集爬虫”的过程，爬虫主要实现批量输入关键字并爬取数据的功能，选择性登...
酒店搜索引擎优化三部曲
第一步:了解自己酒店的产品定位，并查找适合自身产品的关键词和长尾词，查找工具:百度指数、360指数、爱站网、511...
如何挖掘长尾关键词？揭秘长尾关键词挖掘不愿公开的秘籍
引言：长尾关键词挖掘，已成为网络营销推广的重中之中。挖掘好的长尾词，花费少，转化率高!下面将介绍长尾关键词挖掘的几...
长尾关键词如何布局才能达到最优化的效果
之前站长有介绍过如何利用长尾关键词挖词工具5118挖掘长尾关键词了，那当我们挖掘一堆的长尾关键词，怎么样更好的放在...
如何批量整理一个行业3000个关键词？
1、百度爱站网-点击「关键词挖掘」-输入关键词即可查看该词相关的「相关词推荐」、「下拉词推荐」、「需求词推荐」、...
如何快速准确挖掘优质长尾关键词？
如何快速准确挖掘优质长尾关键词？何为长尾词？长尾词是由2到3个关键词组合而成的包含主词的相关词。长尾关键词虽然市...
什么是长尾理论？什么是长尾关键词？长尾词是什么意思？
近日SEO圈总有人问小编，什么是长尾理论?什么是长尾关键词?长尾词是什么意思?长尾词关键词挖掘工具有哪些?郑州网站...
如何搜索关键词？
分析同类网站关键词 .站长工具挖掘关键词长尾关键词工具挖掘（带来非常多的流量）挖掘问答平台的关键词（百度问答...
如何布局长尾关键词
长尾关键词布局非常重要，因为涉及到网站后期优化效果。布局长尾词的第一点是挖掘和筛选长尾词，然后根据长尾词的竞争度以...
关于网站长尾关键词的挖掘和优化
什么是长尾关键词？举个例子：我们的目标关键词“SEO”，那么长尾关键词可以分为“SEO是什么意思”、“SEO教程”...

网友评论

码农的世界

本文标题：爱站网关键字挖掘爬虫开发教程-采集关键词、长尾词数量、收录数和优

本文链接：https://www.haomeiwen.com/subject/djjrtftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

码农的世界

热点阅读

码农的世界

关于我们|服务条款|联系我们|爱站网关键字挖掘爬虫开发教程-采集关键词、长尾词数量、收录数和优|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！