Блог / Экспертиза / Что имеют в виду веб-мастера, когда говорят «закрыть тегом каноникал», или что такое Canonical Tags?

Что имеют в виду веб-мастера, когда говорят «закрыть тегом каноникал», или что такое Canonical Tags?

Автор статьи

Александр Лушин

Ноя 23, 2020

15 мин чтения

На самом деле прижившиеся выражение «закрыть тегом каноникал» не совсем верное. Его суть — использование в секции <head> тега link с атрибутом rel, равным canonical, а также атрибута href со значением, равным URL документа. Визуально исходный код выглядит так:

<link rel="canonical" href="https://seranking.com/" />

Соответственно, canonical — это не тег, а значение атрибута rel, которое дает понять поисковикам, какую версию страницы нужно ранжировать.

Для чего следует использовать canonical?

Canonical используют, когда на сайте кроме основной версии документа (страницы сайта с отдельным URL) есть другие документы с похожим контентом. В таком случае canonical указывает поисковым машинам на основную версии страницы.

Особое внимание обратите на слово «похожим» — далее мы еще вернемся к этому определению.

Вот, что о canonical говорит cправка Google:

Если у вас есть одна страница, доступная по нескольким URL, или разные страницы с похожим контентом (например, версии для мобильных устройств и компьютеров), Google будет считать один URL каноническим, а остальные – его копиями. Сканирование канонического URL будет выполняться намного чаще, чем его копий.

Сообщите нам, какой из URL является каноническим. В противном случае мы выберем его самостоятельно или будем считать оба адреса равноценными, а это может привести к нежелательным последствиям.

Как можно указать канонические URL-адреса?

Существует несколько способов для указания основной версии страницы. Все они более детально описаны в справке Google. Зачастую используется тег <link> — его мы и будем рассматривать в примерах, но также перечислим и другие возможные варианты:

Тег <link> с атрибутом rel=“canonical”
HTTP-заголовок rel=canonical;
Файл Sitemap.

В качестве альтернативы canonical также можно использовать 301 редирект, но нужно учитывать, что переадресация создает совершенно иной эффект, делая доступным только одну версию страницы. Поэтому вы должны быть уверены, что выбранный метод дает именно тот результат, который вы ожидаете.

Практики применения canonical

Canonical обычно используется с целью избежать появления похожего или дублированного контента в результатах поиска. Сценарии появления такого контента рассмотрим ниже.

Важно! Использование rel=“canonical” href=“” /; не запрещает индексацию либо сканирование документа. Canonical является рекомендацией и может быть проигнорирован поисковой системой. Canonical сообщает поисковой машине, какая версия документа должна появиться в результатах поиска и является по вашему мнению основной.

Запрет индексации осуществляется с помощью:

<meta name=“robots” content=“noindex”;
HTTP заголовка X-Robots-Tag: noindex

Больше — в справке Google.

Запрет сканирования осуществляется с помощью файла robots.txt. Больше — в документации Google.

Хороший тон

Использование canonical стало своего рода хорошим тоном. Его внедряют, чтобы предотвратить возможные проблемы с дублированным контентом в будущем, даже если потенциальное наличие дублированного или похожего контента не предполагается.

В простом случае все основные версии страниц, вне зависимости от наличия дублированного или похожего контента, содержат на странице canonical, который указывает на эту же страницу.

Говоря более техническим языком, страница https://seranking.com/subscription.html имеет такой canonical:

<link rel="canonical" href="https://seranking.com/subscription.html" />

То есть значение атрибута href тега link содержит URL страницы, на которой этот тег link расположен.

Именно такое решение и является хорошим тоном, который позволяет избежать возможных проблем и не позволит приписать к странице какие-либо параметры и проиндексировать такие страницы в том случае, если это не обрабатывается СMS.

Параметры сортировки

Классика использования canonical — это указание основного документа при использовании фильтрации, сортировок и других действий, которые приводят к изменению URL-адреса.

Пример — категория с ноутбуками на сайте ebay: https://www.ebay.com/b/Workstation-Laptops-Netbooks/175672/bn_7116632031. Это основная категория, которая содержит ноутбуки для работы и оптимизируется под этот кластер ключевых слов. Canonical для этой страницы имеет такой вид:

<link rel="canonical" href="https://www.ebay.com/b/Workstation-Laptops-Netbooks/175672/bn_7116632031" />

Очевидно, что страница указывает сама на себя.

Страница содержит классические элементы управления:

сортировки по параметрам
изменение способа отображения

Кликнем на изменение способа отображения. Получим отображение в столбик:

Но главное здесь для SEO-специалистов — изменившийся URL. Теперь он имеет такой вид: https://www.ebay.com/b/Workstation-Laptops-Netbooks/175672/bn_7116632031?rt=nc&_dmd=1 .

Обратите внимание на появившиеся в конце URL-адреса параметры. Таким образом реализуется сортировка отображения либо другие необходимые действия. В зависимости от возможных опций сортировки таких страниц с параметрами может генерироваться бесконечное количество. А с точки зрения поисковой машины, каждая вариация с новыми параметрами — это отдельный URL.

В случае если подобные страницы сортировки попадут в индекс поисковика, мы получим внутреннюю конкуренцию, когда страницы с одинаковым или очень похожим контентом, а скорее всего и одинаковым <title>, будут конкурировать между собой. Это приведет к каннибализации ключевых слов и ухудшению ранжирования.

Именно для предотвращения подобных проблем необходимо использовать canonical — он позволяет указать на основную версию документа, которую мы хотим видеть в выдаче. В нашем случае страница сортировки имеет следующий canonical:

<link rel="canonical" href="https://www.ebay.com/b/Workstation-Laptops-Netbooks/175672/bn_7116632031" />

То есть страница указывает на основную версию документа без параметров.

Неоптимизированная фильтрация

Часто при выборе множества параметров фильтрации в интернет-магазине могут создаваться страницы, которые не оптимизированы под какой-либо кластер запросов.

Когда мы говорим об оптимизации под кластер ключевых слов, имеется в виду, что документ имеет:

оптимизированный под конкретные запросы <title>, который отличается от <title> страницы, на которой был выбран фильтр;
оптимизированный уникальный заголовок H1;
товары, отфильтрованные под конкретный кластер ключевых слов.

Стоит отметить, что стандарт HTML5 допускает использование заголовков любого уровня. Упоминая заголовок Н1, мы рассматриваем классическую ситуацию, которая применяется в стандарте HTML4.

Основной тезис, который вы должны понять: одна посадочная страница = одна потребность пользователя. Например, в категории Laptops & Netbooks https://www.ebay.com/b/Laptops-Netbooks/175672/bn_1648276?_dmd=1 есть фильтры, которые создают отдельные посадочные страницы под разные потребности пользователя.

Выбрав фильтр Workstation, мы попадем на отдельную посадочную страницу https://www.ebay.com/b/Workstation-Laptops-Netbooks/175672/bn_7116632031, которую рассматривали в предыдущем примере.

Но вернемся к ситуации, когда фильтры не оптимизированы либо не могут быть оптимизированы. Например, мы хотим посмотреть товары двух брендов. Очевидно, что нет смысла оптимизировать страницу под такие запросы, так как страница каждого бренда должна иметь собственную посадочную. Подобные результаты фильтрации «скрываются» с помощью canonical.

Важно! В каждом конкретном случае canonical нужно рассматривать индивидуально.

Дубли товаров

В некоторых популярных CMS, например Shopify, товар может содержать полный путь к категории, в которой находится. При добавлении товара в несколько категорий создается дублирование одного товара по нескольким URL.

Например:

https://site.com/phone/iphone12/ 
https://site.com/phone/apple/iphone12/
https://site.com/iphone12/

Третий URL-адрес является предпочтительным и два предыдущих должны указывать на него как на основной канонический документ.

Важно! Рекомендуется избегать таких ситуаций и в категориях ссылаться только на основные версии документов, не прибегая к canonical.

UTM-метки и параметры отслеживания

Параметры в URL могут использоваться для сбора определенной информации, но в то же время создавать страницы с дублированным контентом. Например, URL вида https://site.com/page/ может иметь версию с параметрами https://site.com/page/?fbclid=IwAR3cnDV4ERw24pQNVLTFlwKzchPDA1.

Похожая ссылка формируется при переходе из Facebook. В данном случае применение canonical является отличным решением.

Указание основного зеркала сайта

Сайт, доступный по HTTP- и HTTPS-протоколу одновременно, в глазах поисковика является двумя разными сайтами, как и сайты с использованием www и без.

Указанные ниже вариации — это 4 разных сайта:

https://site.com/
http://site.com/
https://www.site.com/
http://www.site.com

Для указания главного зеркала можно использовать canonical.

Например, если главное зеркало — https://site.com/, то остальные:

http://site.com/
https://www.site.com/
http://www.site.com

должны содержать <link rel=“canonical” href=“https://site.com/”>;

Чтобы выбрать, какую версию вы хотите сделать основным зеркалом, используйте команду в site:site.com — она поможет определить, какую версию сайта проиндексировал Google, и понять, каких страниц в поиске больше.

Учтите, что между версией на HTTP-протоколе и версией на HTTPS обязательно стоит выбрать последнюю. Почему HTTPS-протокол предпочтительнее и как переехать на HTTPS без потери позиций и трафика, читайте в этом руководстве. С www все не так однозначно — сделать правильный выбор вам поможет эта статья.

Для указания главного зеркала и простоты управления сайтом рекомендуется использовать 301 редирект.

Канонизация междоменных дубликатов

Если дубли страниц принадлежат разным доменам и вы контролируете оба домена, вы можете выбрать основную каноническую версию страницы на другом домене.

Ошибки при использовании Canonical

Канонизирование страниц разного типа

Вернемся к описанию canonical из справок поисковиков. Google рекомендует использовать canonical, «если у вас есть одна страница, доступная по нескольким URL, или разные страницы с похожим контентом».

Популярная ошибка заключается в указании канонической страницы продукта для страницы категории либо наоборот. В таком случае поисковик может проигнорировать canonical. Аналогично, не стоит указывать для статьи на блоге в качестве canonical страницу продукта.

Ключевой принцип здесь такой: контент на канонической и неканонической странице должен быть одного типа.

Канонические цепочки

Прописывая URL в атрибуте href, обязательно убедитесь, что страница, на которую вы указываете, не имеет canonical, указывающего на другую либо текущую страницу.

Рассмотрим пример. Страница, которую вы хотите канонизировать: https://site.com/phone/iphone12/. Страница, которую вы хотите выбрать канонической: https://site.com/iphone12/. Она уже содержит такой canonical:

<link rel="canonical" href="https://site.com/phone/apple/iphone12/" />

Такой вариант использования canonical некорректный, поскольку он создает каноническую цепочку:

https://site.com/phone/iphone12/ canonical to -> https://site.com/iphone12/ canonical to -> https://site.com/phone/apple/iphone12/

Последняя в этой цепочке — страница https://site.com/phone/apple/iphone12/, а значит скорее всего именно ее поисковики посчитают канонической, но возможна и другая интерпретация. Чтобы не запутать поисковых роботов, лучше все-таки указывать одну каноническую страницу.

В нашем примере это значит, что вам необходимо определиться, какую страницу вы хотите сделать канонической: https://site.com/iphone12/ или https://site.com/phone/apple/iphone12/.

В первом варианте нужно заменить canonical на странице https://site.com/iphone12/, чтобы она указывала на саму себя. При этом страницы https://site.com/phone/iphone12/ и https://site.com/phone/apple/iphone12/ нужно канонизировать.

Чтобы оставить канонической страницу https://site.com/phone/apple/iphone12, нужно сделать так, чтобы остальные похожие страницы ссылались именно на нее. Также страница должна ссылаться на саму себя.

Важно! Будьте осторожны при изменении канонических URL. Обязательно выясните, почему используется те или иные значения.

Указание на URL, недоступный для сканирования или индексации

Выбирая канонический URL, убедитесь, что документ доступен для сканирования, то есть не содержит запрета в файле robots, а также не запрещен для индексации с помощью X-Robots-tag либо <meta name=“robots” content=“noindex” />.

Доступность документа вы можете проверить в Google Search Console либо инструменте SE Ranking «Аудит сайта».

Указание на URL, отдающий код, отличный от 200

Выбирая канонический URL, также убедитесь, что документ доступен и отдает ответ сервера 200. Проверить это можно с помощью аудита сайта в SE Ranking.

Указание на URL c неверным протоколом

При указании канонической страницы ссылайтесь на протокол, который используется в основной версии сайта. Если основная версия сайта использует HTTPS-протокол, то в атрибуте href вы должны указать также HTTPS-версию страницы.

Неканонические страницы в карте сайта

Следите, чтобы в карте сайта фигурировали только основные версии страниц. Другими словами, в карту сайта необходимо включать только те страницы, которые указывают с помощью canonical сами на себя.

Внутренние ссылки на канонизированные URL

Внутренние ссылки должны указывать на основную версию документа. Исключением являются случаи, когда вы с целью улучшения пользовательского опыта или по иной осознанной причине ссылаетесь на канонизированную, не основную версию документа.

Использование canonical в пагинации

Мнения специалистов по этому вопросу разделились.

Вариант 1. Следуем «правилу хорошего тона»: каждая страница пагинации ссылается сама на себя. Например:

https://site.com/catalog/page/2/ содержит <link rel="canonical" href="https://site.com/catalog/page/2/" />.

Я придерживаюсь именно этого метода, поскольку считаю, что пагинация должна быть открыта для поисковых роботов.

Мнение 1 приведено для всестороннего освещения существующих проблем. Мнение 1 не является ошибкой использования canonical.

Вариант 2. Второй вариант сводится к закрытию пагинации от поисковика с помощью canonical, который указывает на первую страницу. Например:

https://site.com/catalog/page/2/ содержит <link rel="canonical2 href="https://site.com/catalog/" />.

Подобная конструкция часто игнорируется поисковиком из-за разного контента на страницах пагинации.

Вариант 3. Существует еще и третий вариант: вовсе не использовать canonical и закрывать пагинацию от поисковиков с помощью <meta name=“robots” content=“noindex, follow” />

Кейс из практики

Сайт на CMS Shopify содержал ошибку, описанную в разделе Дубли товаров. Структура сайта имела вид:

Как видите, на схеме преобладают красные точки — канонизированные страницы. После устранения этой проблемы схема стала выглядеть куда лучше, с преобладающим зеленым цветом:

Структура сайта после устранения проблемы канонизации

И мы получили результат в плане улучшения показов:

Стоит ли использовать canonical или лучше обходить их стороной?

Правильное использование canonical — несложная базовая механика в работе SEO-специалиста. Однако при некорректном применении канонизация может не принести желаемого результата. В итоге сайт будет хуже ранжироваться из-за проблем с дублированным контентом.

Для правильного использования canonical необходимо понять один простой тезис: избегайте создания и генерации дублированного и похожего контента с помощью указания основной версии документа как канонической.

Но во всех правилах бывают исключения. Касаются они и методов борьбы с похожим контентом, и ситуаций, когда в таком дублировании нет ничего плохого. Поэтому вы должны рассматривать каждую ситуацию индивидуально.

5367 views

Автор статьи

Александр Лушин