在百度飓风算法上线后,9月底将推出清风算法重点打击网页标题作弊。
百度官方说明:http://zhanzhang.baidu.com/college/documentinfo?id=1087
从搜索引擎算法的进化历史来看,标题一直都是最重要的排名判断依据之一。
对很多做新闻传播和自媒体的人来说,好的标题甚至是成功的一半。
同样一篇文章,换个标题可能就是10万+。
正是因为标题的重要性,那些借助标题作弊欺骗用户点击的行为也十分常见,用户体验极其糟糕,长久看对搜索引擎的口碑也会有恶劣影响。
比如我想搜索下载某本电子书,搜索结果标题里都有“下载”字样,但页面中只有简单介绍,根本找不到下载地址。而且连续几个搜索结果都是同样情况时,气得想骂人。
强烈支持百度清风算法上线。
但为了避免被算法命中误伤,需要仔细研读百度算法说明,自查并整改标题。
百度对标题和标题作弊的定义
百度对标题的定义:
网页标题是对一个网页的高度概括。举例来说,网站首页的标题就是网站的正式名称。
标题指的是网页代码中的title部分内容
15057299244708.jpg百度对标题作用的说明::
阅读标题,可以了解页面的主体内容,对网页有初步感知。
翻译成白话就是:看到标题就能大概了解页面内容讲的是什么。
百度认为什么是标题作弊呢?
标题作弊主要指标题内容虚假、或在标题中故意堆砌关键词等行为。
这里分了两种情况:
1、标题内容虚假。 指标题表述与实际页面内容不相符,有欺骗用户嫌疑。
2、故意堆砌关键词。 指的多次重复、过度堆砌关键词。
具体什么算虚假,什么算过度呢?百度靠举例子说明。(只能意会,不可能量化)
标题内容虚假
百度一共举了5个例子:
1、假官网情况,非官方网站表述为官网。
2、标题说明中有TXT下载,但是页面不提供下载服务。
3、标题描述为小说下载,但是下载下来的却是APP。
4、在标题中说明有百度云下载、支持在线观看,但是页面既不能下载,又不能在线观看。
5、标题中表述部分虚假,如网页标题中提示有江苏一本大学排名,但页面只有大学名单,而没有排名相关的内容。
总结起来就是:
1、不要假装官网或出现官网字样。
2、标题中出现下载或在线观看就一定要做到。
3、标题提到的展现形式要和实际内容一致。(比如提到排名就要有序号排列的列表,提到趋势就要有趋势图。)
我觉得核心判断标准是:用户不能点击标题浏览完内容后有被骗的感觉。
猜测百度可以实现很好的语义识别功能,也有一些现成的比对数据库。
比如标题出现官网字样时,百度很容易与品牌官网地址做对比。
如果标题中提到小说下载,百度也很容易分析页面中是否包含txt、epub、mobi、chm、umd等后缀的文件可下载,而且可能还会分析文件大小和命名规则。
所有例子基本都可以靠分析实际页面里的元素来得出结论:你的标题是否欺骗用户。
更何况百度还可能使用跳出率、页面停留时间等数据来辅助判断(个人猜测),标题内容虚假后果很严重。
标题重复堆砌
关于标题重复堆砌给了两个错误范例。
第一个例子标题:
<title>情侣网名2017最新版_情侣网名2017独一无二_qq情侣网名 情侣专用_qq网名情侣带i_最新情侣网名一对_经典情侣网名大全2016最新版的</title>
网站被点名后改成了下面的标题,估计合格了:
<title>情侣网名大全_2016-2017最新版_独一无二的_情侣专用</title>
第二个例子标题:
<TITLE>地摊货批发网|地摊369|地摊网|地摊货批发|地摊货源网|地摊项目网|地摊剃须刀|2017最畅销的地摊货|晚上卖什么最好|摆地摊卖什么最赚钱|摆地摊技巧|新奇特玩具|江湖地摊货|地摊货源批发|2017地摊新产品批发|热销地摊货|江湖地摊网|摆摊40种新产品|过年摆地摊赚10万|2017地摊暴利新产品</TITLE>
这毫无疑问的堆砌标题。
但到底什么样才算堆砌,是否有更明确可量化的数字,百度并没有直说。
但从文章中合理标题示例中,反复提及了一个数字3。
比如聚合专题页面属性词不能多于3个,菜谱类标题重复不超过3次及以上。
如果这是百度强烈推荐的做法的话,标题核心词重复次数3次即为上限。
百度眼中的好标题
首页、列表页、内容页、专题页基本上是任何网站都必不可少的页面类型。
百度分别举例说明按什么格式写这些页面的标题是合理的,内容中矩中规,但值得学习参考。
首页标题格式
站点名/品牌名_首页/官网/slogan
例如:
1、京东(JD.COM) 正品低价、品质保障、配送及时、轻松购物!
2、淘宝网淘!我喜欢
3、优酷首页
列表页(频道页)标题格式
列表/频道名上级频道(可省略)站点名
例如:
1、男士频道唯品会
2、男士频道唯品会一家专门做特卖的网站
3、优酷财经,好看的财经 优酷视频
专题页(聚合页)标题格式
主题属性1属性2_上级频道(可省)_站点名
百度建议:核心词只出现一次,属性在页面中出现,属性词不多于3个
例如:
成都旅游攻略玩法路线自由行攻略热门景点美食推荐
这个例子中属性词好像超过3个了。。。
标题要点:核心词只出现一次,属性在页面中出现,属性词不多于3个。
这里注意:如果标题中出现某个属性词,一定也要在内容中也出现。比如提到了“美食推荐”,内容要有对应模块。
内容页标题格式
内容标题列表/频道名(可省)站点名
例如:
致命罗密欧VIP会员高清视频_爱奇艺
标题要点:内容页是指具体的内容页,比如文章详情页、商品详情页、具体视频的播放页等。内容尽量经过加工处理,不直接复用内容中的一段文字;尤其美食菜谱类,重复不超过3次及以上。
总结
只要不堆砌关键词,标题和内容保持一致,不欺骗用户,基本就不会被清风算法命中。
对于UGC类信息网站,比如B2B和分类信息网站,内容都来自于用户,内容页面的标题也基本由用户拟定,所以需要进一步引导用户创造出好的标题,避免关键词堆砌,避免标题出现误导、欺骗浏览者的行为。
比如用户标题中出现“官网”、“官方”、“首页”等词汇时,一定要进入审核流程,可能还需要准备一些教程文档指导用户写标题。
网友评论