菜鸟站长的搜索引擎优化日记(一)
本文来自每日硬知识。微信搜索或者点击每日硬知识,可关注公众号,精彩学习笔记与你分享。
哎呀!网站不被收录了?
今天是2019年5月15日,我发现了1个令人不快的问题,网站不被收录了。
本人于16年学习网站的建设,对Html5,CSS,JS以及Asp.NET的操作,不能说“猛如虎”,但说“敏如猫”,还是当之无愧的。但是对于搜索引擎优化(SEO),却是真真的“蠢如狗”。
16年我注册2个域名,与自己编写的网站进行了绑定。当我在浏览器地址栏中输入“http://www.firesu.net”,按下回车键,自己的网站在浏览器中呈现出来的时候,我欣喜若狂。在网站上线之初,我在百度搜索框中输入:“site:firesu.net”时,网站排名靠前,收录结果也还不错。这可能就是传说中的新站效应。
但是对于技术的热爱,从16年至今,我的精力基本都聚焦在网站框架搭建和代码编写上,从而忽略了对搜索引擎的态度。网站名称想改就改,版式想变就变。
而如今网站版式稳定后,从2019年5月1日起,我连续发布了10多篇原创质量内容,却发现百度的收录从未更新,收录的仍旧是以前的老链接。
于是乎,我陷入了沉思,我可能深深地得罪了“百度蜘蛛”。细思极恐,赶紧抢救才是王道。抢救前,我需要仔细分析网站有哪些致命伤?
网站的第1次病情诊断?
1.百度已经收录的链接内容差,质量低。查看百度收录的链接(site:域名),已经收录的链接都是废弃掉的链接(对网站来说是死链),由于网站是动态网站,删除了内容,但是框架依然存在,搜索引擎每次打开网站后,显示的只有网站框架。对于网站而言,这些链接是死链。但是对于搜索引擎而言,这些链接不算死链,而是内容贫瘠质量差的链接。
2.网站中存在的链接,关键词没有做优化。搜索引擎很重视<a>标签,<a>标签中的文本又会被当做是关键字处理。用站长平台的收录抓取工具,模拟抓取我的网站,发现关键字中存在动态内容。为了用户体验,我在<div>标签外层,放置了<a>标签。而<div>标签中又要显示留言次数。所以导致百度每天抓取同一个连接,但是关键字是不断变化的,不利于收录。
3.网站没有设定搜索引擎限制,也没有站点地图。导致百度收录了寡人原本想隐藏的一些页面。因为我最开始的网站内容显示,为了减轻数据库负载,网站内容是通过iframe中嵌套html实现的。结果搜索引擎收录的页面的同时,也收录了iframe中嵌套的链接。
网站的第1次手术治疗。
1.删除已经收录的死链,提高网站内容质量。
想删除已经被收录的链接,有个先决条件,就是这些页面必须要上报404错误。
众所周知,动态网站就是根据url中的内容,查询数据库,将数据库内容加载到网站框架上,动态生成1个新的页面。
我在最开始的数据处理逻辑中,对于数据库中不存在的数据,因为内容不存在,所以只显示框架。现在看来,这是一个愚蠢的逻辑漏洞。对于查询不到的数据,应该上报404错误(网页不存在),让搜索引擎停止收录。
所以修改框架显示代码,若输入的URL中数据无法查到,则后台跳转到不存在的页面,上报404错误。
而同时,查看大佬们的SEO优化教程,404页面对网站的影响同样很重要,所以我设计了1个简单的404页面。然后修改web.config文件,出现404错误时,跳转到设定的404页面上。
在Web.config中,设置404错误跳转。
此时重新点击百度上收录的旧连接,可以正常弹出404页面。设置OK。
旧链接访问时,可以正常显示404页面后。将百度已经收录的链接写在txt文件中,上传到百度站长平台。
第1步处理完成。
2.优化标签a中的关键字,保证同一个url连接,关键字尽量聚焦。
由于网站之前的做法用<a>标签将<div>标签包起来,修改页面,<a>标签中,只包含关键字。而且为了保证权重,在外链标签上,设定属性为“nofollow”。
修改完成后,重新抓取页面。标签关键字变得很简洁整齐。第2步处理完成。
3.补充站点地图和robot.txt文件,来限制搜索引擎的收录范围。
动态网站的好处就是,可以动态生成站点地图。对于站点地图的更新,设计单击按钮,遍历所有网页,可动态制作站点地图。
制作好站点地图后,打开百度站长平台,上传Sitemap,隔数分钟后,查看状态正常,抓取Url数量26条。第3步处理完成。
处理完已发现的问题后,我们坐观其变,看后续的收录情况。
网友评论