SEO - 规范化网址



规范标签:它们是什么?

一个称为 rel="canonical" 的 HTML 元素指示重复、几乎相同或可比较网站的主要版本。换句话说,您可以使用规范标签来识别内容的哪个版本是原始的、真实的版本。当用户在 Google 搜索中执行搜索时,Google 将索引规范化 URL 并将其显示给用户。

<link rel="canonical" href="https://wwwtutorialspoint.com/seo/what-is-seo.htm"/>

规范化 URL 的类型

规范化 URL 有两种类型:

  • 自引用规范化 URL

  • 将用户从备用页面重定向到所需页面的规范化 URL。

可以使用 Google Search Console 的 URL 检查工具查看用户声明和 Google 选择的规范化 URL。

规范化 URL:为什么它们很重要?

  • 由于 Google 主要索引规范化 URL,因此规范化 URL 至关重要。简而言之,如果您的网站上有重复的内容——也就是说,网页内容几乎相同或完全相同——Google 只会索引其中一个(即规范化 URL)。

  • 如果您的规范化 URL 设置正确,Google 将识别您的选择并将其网站识别为官方网站。但是,如果您没有为相同或几乎相同的页面提供规范化 URL,Google 将根据其最准确的评估确定规范化 URL。

  • 您可能不希望 Google 选择该地址作为规范化 URL。因此,如果您希望最大程度地确保其真实性,则必须手动建立规范化 URL。

规范化 URL 的指南

尽管规范化很复杂且很高级,但大多数网站所有者需要了解一些最佳实践:

使用自引用规范标签

链接到自身页面的页面的规范标签称为自引用规范标签。

避免在您的网站地图中使用非规范化 URL

因为 Google 将非规范化 URL 视为建议的规范化 URL,所以建议不要将它们包含在您的网站地图中。

规范化 URL 不应配置为 404 页面

当无法找到网站或资源时,浏览器会提供 404 错误代码。最常见的原因是网站已被删除或处于非活动状态。

多个规范标签不可接受

在单个网页上使用多个规范标签不是可接受的做法,Google 可能会忽略所有规范标签,并选择不索引该网站。

为什么我会出现重复内容?

网站上出现重复内容的原因有很多,包括:

  • 特定区域的内容,例如一篇针对美国和英国的单独 URL 的文章,但基本内容是相同的文本,使用相同的语言。

  • 针对不同类型设备的变体,例如具有移动和桌面版本的网页。

  • 协议变体,例如网站的 HTTP 和 HTTPS 版本。

  • 例如,类别页面上排序和筛选操作的结果是网站功能。

  • 意外变体包括,例如,无意中将网站的测试版本公开给爬虫。

实施规范标签:基础知识

实施规范化很简单。您必须始终遵循五个明显的原则:

规则一:仅使用绝对 URL

应使用以下框架:<link rel="canonical" href="https://tutorialspoint.com/example-page/" />

与此相反:<link rel="canonical" href="/example-page/" />

规则二:使 URL 小写

在为规范标签使用小写 URL 之前,您必须确保已在服务器上配置了小写 URL。Google 可能将小写和大写 URL 视为两个不同的 URL。

规则三:选择合适的域名协议(HTTP 或 HTTPS)

确保您在从 SSL 迁移到 HTTP 后,规范标签中不包含任何 HTTP URL。这样做可能会导致混乱的情况,并产生意外的后果。如果您在安全域(HTTPS)上,请使用以下格式的 URL:

<link rel="canonical" href="https://tutorialspoint.com/example-page/" />

相比之下

<link rel="canonical" href="https://tutorialspoint.com/example-page/" />

无论如何,如果您使用 HTTP,则反之亦然。

规则四:应使用规范自引用标签

在使用自定义 CMS(内容管理系统)时,开发人员必须定义自引用 URL。但是,大多数当前的主流 CMS 都能有效地自动执行此操作。

规则五:每个网页都应具有一个规范标签

如果网页包含多个规范标签,则 Google 不会同时考虑这两个规范标签。当存在多个 rel=canonical 声明时,Google 可能会忽略所有 rel=canonical 建议。

使用规范标签的最佳方式

规范化 URL 可以通过五种不同的方法指定。规范化信号包括以下内容:

  • (rel=canonical) HTML 标签。

  • HTTP 协议的标头。

  • 网站地图。

  • 重定向到 301 页面。

  • 内部链接。

规范化时不要做什么?

规范化的概念有点复杂。因此,许多人需要了解规范化以及最佳实践。

尝试规范化的人经常会犯以下错误:

  • 规范化 URL 配置为“noindex”。

  • 使用 robots.txt 阻止对规范化 URL 的访问。

  • 将每个带分页的网页的规范化 URL 设置为主页。

  • 选择规范化 URL 的 HTTP 代码状态为 4XX。

  • 添加多个 rel=canonical 标签

  • 在没有规范标签的情况下使用 hreflang

  • 源代码的<body>部分中的 rel=canonical 标签。

结论

规范标签相对简单。简单地说,它们需要一些时间来理解。不要忘记,规范标签充当搜索引擎爬虫的提示,而不是指令。因此,它们可能会选择与您指定的规范标签不同的规范标签。

广告