美文网首页
【SEO学习之路】百度清风算法解读,如何小心自查避免算法命中

【SEO学习之路】百度清风算法解读,如何小心自查避免算法命中

作者: 向阳乔木 | 来源:发表于2017-09-18 20:02 被阅读25次

在百度飓风算法上线后,9月底将推出清风算法重点打击网页标题作弊。

百度官方说明:http://zhanzhang.baidu.com/college/documentinfo?id=1087

从搜索引擎算法的进化历史来看,标题一直都是最重要的排名判断依据之一。

对很多做新闻传播和自媒体的人来说,好的标题甚至是成功的一半。

同样一篇文章,换个标题可能就是10万+。

正是因为标题的重要性,那些借助标题作弊欺骗用户点击的行为也十分常见,用户体验极其糟糕,长久看对搜索引擎的口碑也会有恶劣影响。

比如我想搜索下载某本电子书,搜索结果标题里都有“下载”字样,但页面中只有简单介绍,根本找不到下载地址。而且连续几个搜索结果都是同样情况时,气得想骂人。

强烈支持百度清风算法上线。

但为了避免被算法命中误伤,需要仔细研读百度算法说明,自查并整改标题。

百度对标题和标题作弊的定义

百度对标题的定义:

网页标题是对一个网页的高度概括。举例来说,网站首页的标题就是网站的正式名称。

标题指的是网页代码中的title部分内容

15057299244708.jpg

百度对标题作用的说明:

阅读标题,可以了解页面的主体内容,对网页有初步感知。

翻译成白话就是:看到标题就能大概了解页面内容讲的是什么。

百度认为什么是标题作弊呢?

标题作弊主要指标题内容虚假、或在标题中故意堆砌关键词等行为。

这里分了两种情况:

1、标题内容虚假。 指标题表述与实际页面内容不相符,有欺骗用户嫌疑。

2、故意堆砌关键词。 指的多次重复、过度堆砌关键词。

具体什么算虚假,什么算过度呢?百度靠举例子说明。(只能意会,不可能量化)

标题内容虚假

百度一共举了5个例子:

1、假官网情况,非官方网站表述为官网。
2、标题说明中有TXT下载,但是页面不提供下载服务。
3、标题描述为小说下载,但是下载下来的却是APP。
4、在标题中说明有百度云下载、支持在线观看,但是页面既不能下载,又不能在线观看。
5、标题中表述部分虚假,如网页标题中提示有江苏一本大学排名,但页面只有大学名单,而没有排名相关的内容。

总结起来就是:

1、不要假装官网或出现官网字样。
2、标题中出现下载或在线观看就一定要做到。
3、标题提到的展现形式要和实际内容一致。(比如提到排名就要有序号排列的列表,提到趋势就要有趋势图。)

我觉得核心判断标准是:用户不能点击标题浏览完内容后有被骗的感觉。

猜测百度可以实现很好的语义识别功能,也有一些现成的比对数据库。

比如标题出现官网字样时,百度很容易与品牌官网地址做对比。

如果标题中提到小说下载,百度也很容易分析页面中是否包含txt、epub、mobi、chm、umd等后缀的文件可下载,而且可能还会分析文件大小和命名规则。

所有例子基本都可以靠分析实际页面里的元素来得出结论:你的标题是否欺骗用户。

更何况百度还可能使用跳出率、页面停留时间等数据来辅助判断(个人猜测),标题内容虚假后果很严重。

标题重复堆砌

关于标题重复堆砌给了两个错误范例。

第一个例子标题:

<title>情侣网名2017最新版_情侣网名2017独一无二_qq情侣网名 情侣专用_qq网名情侣带i_最新情侣网名一对_经典情侣网名大全2016最新版的</title>

网站被点名后改成了下面的标题,估计合格了:

<title>情侣网名大全_2016-2017最新版_独一无二的_情侣专用</title>

第二个例子标题:

<TITLE>地摊货批发网|地摊369|地摊网|地摊货批发|地摊货源网|地摊项目网|地摊剃须刀|2017最畅销的地摊货|晚上卖什么最好|摆地摊卖什么最赚钱|摆地摊技巧|新奇特玩具|江湖地摊货|地摊货源批发|2017地摊新产品批发|热销地摊货|江湖地摊网|摆摊40种新产品|过年摆地摊赚10万|2017地摊暴利新产品</TITLE>

这毫无疑问的堆砌标题。

但到底什么样才算堆砌,是否有更明确可量化的数字,百度并没有直说。

但从文章中合理标题示例中,反复提及了一个数字3。

比如聚合专题页面属性词不能多于3个,菜谱类标题重复不超过3次及以上。

如果这是百度强烈推荐的做法的话,标题核心词重复次数3次即为上限

百度眼中的好标题

首页、列表页、内容页、专题页基本上是任何网站都必不可少的页面类型。
百度分别举例说明按什么格式写这些页面的标题是合理的,内容中矩中规,但值得学习参考。

首页标题格式

站点名/品牌名_首页/官网/slogan

例如:
1、京东(JD.COM) 正品低价、品质保障、配送及时、轻松购物!
2、淘宝网
淘!我喜欢
3、优酷首页

列表页(频道页)标题格式

列表/频道名上级频道(可省略)站点名

例如:
1、男士频道唯品会
2、男士频道
唯品会一家专门做特卖的网站
3、优酷财经,好看的财经
优酷视频

专题页(聚合页)标题格式

主题属性1属性2_上级频道(可省)_站点名

百度建议:核心词只出现一次,属性在页面中出现,属性词不多于3个

例如:
成都旅游攻略玩法路线自由行攻略热门景点美食推荐

这个例子中属性词好像超过3个了。。。

标题要点:核心词只出现一次,属性在页面中出现,属性词不多于3个。

这里注意:如果标题中出现某个属性词,一定也要在内容中也出现。比如提到了“美食推荐”,内容要有对应模块。

内容页标题格式

内容标题列表/频道名(可省)站点名

例如:
致命罗密欧VIP会员高清视频_爱奇艺

标题要点:内容页是指具体的内容页,比如文章详情页、商品详情页、具体视频的播放页等。内容尽量经过加工处理,不直接复用内容中的一段文字;尤其美食菜谱类,重复不超过3次及以上。

总结

只要不堆砌关键词,标题和内容保持一致,不欺骗用户,基本就不会被清风算法命中。

对于UGC类信息网站,比如B2B和分类信息网站,内容都来自于用户,内容页面的标题也基本由用户拟定,所以需要进一步引导用户创造出好的标题,避免关键词堆砌,避免标题出现误导、欺骗浏览者的行为。

比如用户标题中出现“官网”、“官方”、“首页”等词汇时,一定要进入审核流程,可能还需要准备一些教程文档指导用户写标题。

相关文章

网友评论

      本文标题:【SEO学习之路】百度清风算法解读,如何小心自查避免算法命中

      本文链接:https://www.haomeiwen.com/subject/wfzbsxtx.html