今天闲来无事,搜了一下 Google 的 搜索引擎优化 (SEO) 指南,有几点收获比较深,记录一下。
要想让搜索引擎喜欢来抓取网站,就要投其所好,了解搜索引擎的相关规范。
搜索引擎如何获取地址
搜索引擎需要获得每部分内容的唯一网址,才能抓取内容并将其编入索引,并使用户转到相应内容。
不同内容(例如某个商店中的不同产品)以及修改后的内容(例如某内容的翻译版本或不同地区的版本)需要使用单独的网址,才能在搜索结果中得到恰当的展示。
一般情况下,网址会分为多个不同的部分:
代码语言:javascript复制protocol://hostname/path/filename?querystring#fragment
例如:
代码语言:javascript复制https://www.w3h5.com/RunningShoes/Womens.htm?size=8#info
Google 建议网站尽可能使用 https://
,区分 www
版本和非 www
版本(例如,www.w3h5.com
或仅 w3h5.com
)。
将网站添加到 Search Console 时,建议同时添加 http://
版本和 https://
版本以及 www
版本和非 www
版本。
路径、文件名和查询字符串决定了访问服务器上的内容。这三个部分区分大小写,因此使用 FILE
和 file
将得到不同的网址。
主机名和协议不区分大小写,大小写不同不会产生任何影响。
示例中的 #info
通常用于标识浏览器应滚动到网页的哪个部分,内容本身通常是一样的,因此搜索引擎一般会忽略。
指向首页时,主机名后的结尾斜线是可选的,不论有没有斜线都将指向相同的内容(https://w3h5.com/
和 https://w3h5.com
的效果是一样的)。
对于路径和文件名,结尾斜线的存在与否将产生不同的网址(斜线可指明是文件还是目录),例如,https://w3h5.com/fish
和 https://example.com/fish/
不相同。
导航结构对搜索引擎非常重要
网站导航可以方便访问者快速找到所需内容,也可以帮助搜索引擎了解哪些是站长认为重要的内容。
虽然 Google 的搜索结果是在网页级别提供的,但 Google 也希望了解网页在网站这个更大层面上的作用。
根据首页规划导航结构
所有网站都有首页或根网页,这通常是网站上最常被访问的网页,也是很多访问者浏览网站的起点。
除非您的网站只有极少量的网页,否则需要考虑访问者将如何从一个内容宽泛的网页(根网页)转到所含内容更具体的网页。
围绕特定主题的网页是否多到需要创建一个网页来介绍这些相关的网页(例如,根网页 -> 相关主题列表 -> 特定主题)?您是否有数百种不同的产品,需要分类到多个类别网页和子类别网页中?
简洁的语义化网址更容易传达内容信息
为网站上的文档创建描述准确的类别和文件名,不仅可以帮助您更好地组织网站,而且可以为希望链接到您的内容的用户创建更简单、易于使用的网址。
如果网址极为冗长、含义模糊,并且包含很少的可识别字词,访问者可能会望而却步。
下面的网址可能会造成困惑且不易于使用:
代码语言:javascript复制https://www.w3h5.com/folder1/22447478/x2/14032015.html
如果您的网址有明确的含义,在不同上下文中都会更实用且更易于理解,像下面这样:
代码语言:javascript复制https://www.w3h5.com/article/ten-rarest-baseball-cards.html
最后需要注意的是,文档的网址通常以某种形式显示在 Google 搜索结果中的文档标题附近。
Google 擅长抓取各种类型的网址结构(即使它们相当复杂),但花一些时间尽量让您的网址变得简单才是上策。
Google 给出了几点建议:
在网址中使用字词
如果网址具有与网站内容以及结构相关的字词,则对浏览您网站的访问者来说更易于使用。
避免以下做法:
- 使用含有不必要的参数和会话
ID
的冗长网址。 - 使用通用网页名称,例如
page1.html
。我的博客就犯了这样的错误,后悔没有早点看了。 - 使用过多的关键字,例如
baseball-cards-baseball-cards-baseballcards.html
。
创建简单的目录结构
使用可有效组织内容的目录结构,让访问者轻松知晓他在网站上的位置。尝试使用目录结构指明在该网址中找到的内容类型。
避免以下做法:
- 具有深层嵌套的子目录,例如
.../dir1/dir2/dir3/dir4/dir5/dir6/page.html
。 - 使用与其内容无关的目录名称。
为每个文档仅提供一种版本的访问网址
为防止将某些用户链接到网址的一个版本而将其他用户链接到另一版本(这可能会导致在这两个网址之间拆分该内容的声誉),请确保在网页结构和内部链接中使用同一个网址。如果您确实发现用户在通过多个网址访问相同的内容,那么设置一个从非首选网址到主导网址的 301 重定向是一个很好的解决方案。如果无法重定向,您还可使用 rel="canonical" link 元素。
避免以下做法:
- 让子网域和根目录的网页访问相同内容,例如
w3h5.com/page.html
和sub.w3h5.com/page.html
。
主题结构清晰明了
合理安排内容结构,可以让访问者清楚地知道内容主题。将内容划分为符合逻辑的多个段落或部分,可帮助用户更快地找到想要的内容。
避免以下做法:
- 将大量不同主题的文字堆砌到网页上,不分隔段落、子标题或布局。
发布新鲜独特的内容
新内容不仅可以让现有访问者群体再次访问网站,还能吸引新访问者。
避免以下做法:
- 稍加改动(甚至复制)现有内容几乎不能为用户带来额外价值。
- 网站上到处是重复或近似重复的内容。
针对用户而非搜索引擎来优化内容
根据访问者的需求设计网站并确保网站易于搜索引擎访问,这样做会产生积极的影响。
这里往往有一个误区,就是大多数人更加专注对搜索引擎进行优化,忽略了用户体验,这样会适得其反。
避免以下做法:
- 插入大量针对搜索引擎的不必要关键字,这些关键字让用户感到厌烦或对他们毫无意义。
- 含有“试图访问此网页时的常见拼写错误”等对用户几乎没有价值的文本。
- 以欺骗手法对用户隐藏文字,但对搜索引擎显示这类文字。
提供适量内容来阐明您的主题
制作优质内容至少需要在以下某个方面付出努力:时间、精力、专业知识和才能/技能。请确保内容准确无误、文笔清晰并且全面。例如,如果您在网页中描述了一个食谱,请提供易于理解的完整食谱,而不只是菜肴的一组配料或基本描述。
避免以下做法:
- 提供不足以阐明网页用途的内容。
避免投放会分散用户注意力的广告
网页上可以出现广告,不过,请不要让广告分散用户注意力,或妨碍他们浏览网站内容。例如,让用户难以使用网站的广告、补充内容或插页(在用户希望看到的内容之前或之后显示的网页)。详细了解此主题。
避免以下做法:
- 在网页上投放会分散用户注意力的广告。
设置链接格式,提高其识别度
让用户能够轻松区分常规文本和链接的定位文字。如果用户没有看到链接或意外点击了它们,您内容的实用性将降低。
避免以下做法:
- 使用 CSS 或文本样式,让链接看起来像常规文本。
注意所链接到的网站(外链)
将自己的网站链接至其他网站时,这些网站也会因您网站的声誉而获益。
有时,用户会通过在您网站的评论版块或留言板中添加自己网站的链接来使自己获益。或者,有时您是从负面角度提及某个网站,但同时您又不希望它因为您的网站的声誉而跟着沾光。
例如,假设您正在撰写关于垃圾评论的博文,并且想引用一个最近对您的博客发表了垃圾评论的网站。您想提醒其他人提防该网站,因此,您在自己的内容中加入了指向该网站的链接;但是,您当然不希望这样的链接使得该网站因为您的声誉而获益。这时候就非常适合使用 nofollow
。
另一个适合使用 nofollow
属性的情形就是微件链接。如果您使用了第三方微件来丰富网站的体验及吸引用户,请检查该微件是否包含您不想随其一起放到网站上的链接。某些微件可能会向您的网站添加链接,而这些链接并不属于编辑精选内容,并且还可能包含您作为网站所有者也许无法控制的定位文字。如果无法从微件中移除这类垃圾链接,您随时可以使用 nofollow
停止跟踪这些链接。如果您为自己提供的功能或内容创建微件,请务必在默认代码段的链接中包含 nofollow
。最后,如果您不希望搜索引擎跟踪网页中的任何链接,可以在网页的 <head>
标记中添加 <meta name="robots" content="nofollow">
标记。
使用 nofollow 来打击垃圾评论
如需告知 Google 不要跟踪链接到的网页或链接到的网页不能因您网页的声誉而获益,请将链接的 rel
属性值设为 nofollow
或 ugc
。如需让搜索引擎不跟踪某个链接,需要在该链接的锚标记中添加 rel="nofollow"
或更具体的属性,例如 ugc
,如下所示:
<a href="https://www.example.com" rel="nofollow">Anchor text here</a>
或:
代码语言:javascript复制<a href="https://www.example.com" rel="ugc">Anchor text here</a>
如果您网站上的博客启用了公开评论功能,那么这些评论中的链接可能会将您的声誉传递给某些您可能不愿意为其背书的网页。
网页上的博客评论区域很容易出现垃圾评论。不跟踪该区域中用户添加的链接可确保您的网页来之不易的声誉不被垃圾网站沾光。
使用 HTML 图片
使用 HTML 图片元素在内容中嵌入图片。
使用 HTML <img>
或 <picture>
元素
语义 HTML 标记有助于抓取工具找到并处理图片。使用 <picture>
元素,您还可以针对不同屏幕尺寸为自适应图片指定多个选项。您还可以在图片上使用 loading="lazy"
属性,提高用户的网页加载速度。
避免以下做法:
- 使用 CSS 显示您希望我们编入索引的图片。
以上是我感觉比较重要的内容,记录一下,方便以后反复查阅。
未经允许不得转载:Web前端开发资源网 » 读Google搜索引擎优化 (SEO) 指南的几点收获