
搜索引擎在他们爬取网页和理解内容上存在许多技术壁垒。对于同一个网站页面,你我看起来的样子和搜索引擎理解的样子,可能大相径庭。在这一章节,我们主要探讨哪些核心的页面建设和链接优化设计,既可以照顾到访客,又能顾及搜索引擎友好。与你的程序员、架构师和设计人员分享这一部分知识,以便所有参与官网构建的各方都能在同一频道上。

可索引的内容
若想在搜索结果中排名靠前,你最重要的内容应该是HTML文本格式。图片、Flash、Java,还有其他非文本内容,经常被搜索引擎的爬虫忽略和绕行。也就是说,确保你的单词、短语能够被目标访客搜索到并访问,就是将他们置于页面的HTML文本中。当然,随着视频直播平台的风靡,利用云计算、大数据、人脸识别等技术,更高级的搜索优化方法,大格式的视频内容也可以进行搜索优化。
在HTML中给gif、jpg或png格式的图片进行“alt属性”的文本描述,给搜索引擎一个提示;用导航和可爬链接补充搜索框;在页面上给Flash或者Java格式的文件以文本描述;提供音频、视频文件的文字描述内容,关键词能够被搜索识别。
以搜索引擎的视角审视你的站点
许多网站在可索引方面存在重大问题,双向检查十分必要。使用类似页面缓存的查看工具,SEO-browers.com,或者是MozBar,都能一目了然的了解到哪些内容虽浏览器可见,却不可被索引。检查这篇你正在看的页面,观察有何不同?

通过页面缓存查阅工具,我们可以看到,在搜索引擎中,下面这个网站的主页并不像我们所看到的那么丰富,这使得搜索引擎很难解释其相关性。

通过页面缓存查看工具,我们看到的是一片荒芜之地。甚至没有文字告诉我们这一页包含了与猴子搏斗的斧子。这个网站完全是用Flash构建的,但遗憾的是,这意味着搜索引擎不能索引到任何文本内容,甚至不能索引到单个游戏的链接。如果没有任何HTML文本,这个页面在搜索结果中不会有好的排名。
能被搜索到的链接结构
就像搜索引擎需要看到内容一样,在基于关键词的索引中展示页面,它们还需要查看链接结构,以便在一开始就找到相关内容。一个可爬取的链接结构,给爬虫浏览网站的路径,对于他们在网站上找到所有页面是至关重要的。成千上万的网站犯了一个严重的错误,即以搜索引擎无法访问的方式构造他们的链接导航,这阻碍了他们在搜索引擎的索引中列出页面的能力。


链接标签可以包含图像,文本或其他对象,所有这些都可以在页面上提供可点击区域,用户可以通过该区域移动到另一个页面。a href引导的超链接引用位置告诉浏览器(和搜索引擎)链接指向的位置。后面的描述部分,就是访问者链接的可见部分称为SEO世界中的锚文本,它描述链接指向的页面。这是链接最基本的格式,对于搜索引擎来说,这非常易于理解。爬虫知道他们应该将这个链接添加到网络的引擎链接图中,并用它来计算与查询无关的变量,然后按照索引引用页面的内容。
让我们列举一些页面不被爬取的常见原因
1、需要在线提交表格才能抵达的页面。无论哪种情况,搜索抓取工具通常都不会尝试提交表单,因此任何可通过表单访问的内容或链接对引擎都是不可见的。
2、如果使用JavaScript进行链接,你可能会发现搜索引擎要么不爬行,要么对嵌入其中的链接不太重视,应该替换成标准的HTML文本链接。
3、指向那些被标记阻止的页面,禁止爬取的页面。
4、多架构式的网站和架构混乱的网站。
5、一些网站管理员相信,如果他们在自己的网站上放置一个搜索框,那么引擎就能找到所有访问者搜索的东西。不幸的是,爬行器不会执行搜索来查找内容,导致数百万页面无法访问。
6、那些指向Flash、Java或者其他插件中的链接。
7、带有数百个链接的页面有可能不会让所有链接都被抓取和索引。
如果你能成功避开以上这些陷阱,相信搜索引擎一定能够轻松抵达你的页面。

一个拥有大量入站链接的网站将积累许多nofollowed链接,这不是一件坏事。事实上,Moz的排名因素显示,排名较高的网站往往比排名较低的网站拥有更高的入站nofollow链接比例。
关键词使用和定位
关键词是搜索过程的基础,是自然语言搜索的基石。事实上,整个信息检索科学(包括Google等基于网络的搜索引擎)都是基于关键词。随着引擎对网页内容进行爬取和索引,他们会在基于关键词的索引中跟踪这些页面,而不是将所有250亿个网页存储在一个数据库中。数百万和数百万个较小的数据库(每个数据库都以特定的关键词或词组为中心)允许引擎在几秒钟内检索他们所需的数据。
显然,如果您希望自己的网页有机会在“主题婚礼”的搜索结果中进行排名,那么确保“主题婚礼”一词是您文档可抓取内容的一部分,就是明智之举。
关键词控制
关键词主导我们如何传达搜索意图并与引擎进行交互。当我们输入文字进行搜索时,引擎会根据我们输入的字词匹配页面进行检索。单词顺序,拼写,标点符号和大写是提供给引擎用来帮助检索正确页面并对其排序的附加信息。
搜索引擎测量关键词在页面上的使用方式,以帮助确定特定文档与查询的相关性。优化页面排名的最佳方法之一:确保您想要排名的关键词在标题,文本和元数据中显著使用。
一般来说,当你的关键词更具体化时,你可以缩小搜索结果的竞争范围,并提高获得更高排名的机会。就是将短关键词忧化成长尾关键词。请注意,尽管广义术语有很多结果,但具体语句的结果却相当少。比如:沈阳哪里有可以举办草坪婚礼的地方?
关键词滥用
网络搜索兴起初期,人们滥用关键词来误导引擎,将关键词“填充”到文本,URL,元标记和链接中。不幸的是,到了今天,这种策略对你的网站来说几乎总是有害无益。
在早期,搜索引擎依靠关键词使用作为主要相关性信号,而不管关键词的价值。今天,虽然搜索引擎仍然不能阅读和理解文本和人类,但机器学习的使用使他们更接近这一理想,就是自然语义分析。
最好的做法是自然而有策略地使用关键词。使用关键词的目的不是要对所有关键词进行高排名,而是要进行用户洞察,发现他们都在用什么关键词来寻找你的品牌或网站。
页面优化
关键词的使用和定位仍然是搜索引擎排名算法的一部分,我们可以应用一些有效的关键词使用技术来帮助优化已创建好的页面。
使用关键词:在标题标签中至少一次。尽量让关键词尽可能靠近标题标签的开头,突出显示在页面顶部附近;页面正文中至少包含两到三次,包括变体,如果有很多文本内容,可能还会再多几次;至少一次使用在页面图像alt属性中,这不仅有助于网络搜索,还有图像搜索,偶尔也会带来有价值的流量;在URL中的锚文本描述中至少有一次使用。
标题标签
页面的标题标签元素,意味着对页面内容的准确,简洁的描述,这对用户体验和搜索引擎优化至关重要。
注意长度
搜索引擎只在搜索结果中显示标题标签的前65-75个英文字符(之后,引擎显示省略号 - “...” - 表示标题标签何时被切断)。这也是大多数社交媒体网站允许的一般限制,所以坚持这个限制通常是明智的。但是,如果你定位了多个关键词(或特别长的关键词组),并且将它们放在标题标签中对排名非常重要,则建议延长排名时间。
将重要的关键词放在前面
标题标签的开头越接近关键词,它们对排名的帮助越大,用户在搜索结果中点击它们的可能性就越大。
包括品牌名称
用品牌名称来结束每个标题标签,因为这有助于提高品牌知名度,并为喜欢和熟悉品牌的人创造更高的点击率。有时将您的品牌放置在标题标签的开头部分(例如您的主页)也是有意义的,因为标题标签开头的单词更重要,这依据内容而定。
考虑可读性和情感共鸣
标题标签应该是描述性的和可读的。标题标签是新的访问者与您品牌的第一次互动,应该传达可能最积极的印象。创建引人注目的标题标签有助于吸引人们关注搜索结果页面,并吸引更多访问者访问你的网站。这强调了SEO不仅关于优化和关键词策略使用,还关系到整个品牌的用户体验。
接下来还有许多内容待续,今天先学习到这里,以下是剧透:
Meta Tags
URL Structures URL
URL Construction Guidelines
Canonical and Duplicate Versions of Content
Rich Snippets
Defending Your Site's Honor
网友评论