Зачем это нужно
Когда у одного контента есть несколько URL (с www и без, с / на конце и без, с UTM-метками), краулеры распыляют сигналы по копиям. Авторитетность источника размывается, и в нейросводки страница не попадает. Цепочки редиректов (A → B → C → D) — отдельная проблема: Алиса прерывает обход после 2-3 хопов и не доходит до контента.
Как сделать
- На каждой странице — тег
<link rel="canonical" href="...">с правильным URL - Выбрать одно главное зеркало: либо www, либо без www. Все остальные — 301 на основное
- Слеш на конце URL — единый формат для всего сайта
- UTM-метки и query-параметры — закрыть через canonical на чистый URL
- Проверить редиректы на одношаговость:
curl -I -L https://сайт.ru/старый-url— не должно быть больше одного 301 - Удалить устаревшие категории, теги, архивы автора, если они не несут пользы
Как проверить
Я.Вебмастер → «Индексирование» → «Страницы в поиске» покажет дубли и страницы с проблемами. Дополнительно прогнать сайт через Screaming Frog: фильтр «Canonicalised» и «Redirect Chains» покажут все проблемы за один обход.
Типичные ошибки
Canonical указывает сам на себя, но при этом тег noindex стоит — страница исключается из индекса. Поменяли структуру URL, забыли убрать старые редиректы, образовалась цепочка из 4-5 хопов.