Техаудит и индексация

Найти и обработать битые ссылки (404)

Важно

Зачем находить и обрабатывать битые ссылки

Битая ссылка — это ссылка, которая ведёт на несуществующую страницу. Пользователь кликает и видит ошибку 404. Для SEO это проблема сразу в нескольких плоскостях: робот тратит бюджет сканирования на мёртвые URL, ссылочный вес внешних ссылок теряется в пустоту, пользователи уходят с сайта. Если на сайте десятки или сотни битых ссылок, поисковик может снизить общую оценку качества сайта.

Битые ссылки появляются постоянно: при удалении страниц, изменении URL, переезде на новый домен, обновлении каталога товаров, удалении старых статей. На крупных сайтах, которые развиваются годами, количество 404-ошибок может исчисляться тысячами. Регулярная проверка и устранение — обязательная часть технического обслуживания.

Пошаговая инструкция

Шаг 1. Найдите битые ссылки через Screaming Frog

Screaming Frog SEO Spider — самый надёжный способ обнаружить все 404-ошибки на сайте, потому что он обходит сайт как поисковый робот и проверяет каждую ссылку.

  1. Запустите Screaming Frog, введите адрес сайта и начните сканирование.
  2. После завершения перейдите на вкладку «Response Codes».
  3. В фильтре выберите «Client Error (4xx)». Здесь собраны все URL, которые отдают ошибку 404 (и другие 4xx-коды).
  4. Для каждого битого URL проверьте столбец «Inlinks» — сколько внутренних ссылок ведёт на эту мёртвую страницу. Нажмите на число, чтобы увидеть конкретные страницы-источники.
  5. Экспортируйте отчёт: «Reports» → «Client Errors» → «Inlinks». Получите таблицу с битыми URL и страницами, которые на них ссылаются.

Также проверьте внешние ссылки: вкладка «External» → фильтр «Client Error (4xx)». Это ссылки с вашего сайта на другие ресурсы, которые перестали работать. Их тоже нужно обновить или удалить.

Шаг 2. Проверьте ошибки в Яндекс Вебмастере

В Яндекс Вебмастере перейдите в «Индексирование» → «Страницы в поиске» → «Исключённые страницы». Фильтруйте по причине «Ошибка HTTP: 404». Здесь Яндекс показывает URL, которые он пытался просканировать, но получил ошибку 404.

Важный нюанс: в этом отчёте могут быть URL, которые никогда не существовали на сайте — например, URL из спамных ссылок или результат опечаток. Такие URL не требуют исправления, но стоит убедиться, что ваша 404-страница корректно отдаёт код 404 (а не 200), иначе поисковик может проиндексировать пустую страницу.

Шаг 3. Проверьте ошибки в Google Search Console

В Google Search Console перейдите в «Страницы» → фильтр «Не найдено (404)». Google показывает страницы, которые он обнаружил через ссылки (внутренние или внешние), но не смог загрузить.

Обратите особое внимание на URL, которые ранее были проиндексированы, а теперь отдают 404. Это означает, что Google уже показывал эти страницы в поиске, пользователи могли на них заходить, а теперь видят ошибку. Такие случаи — приоритет для исправления.

Шаг 4. Классифицируйте битые URL

Не все 404-ошибки одинаково важны. Разделите найденные URL на категории по приоритету:

Критические (исправить немедленно):

  • Страницы, на которые ведут внешние ссылки с других сайтов — вы теряете ссылочный вес.
  • Страницы, которые ранее получали органический трафик — пользователи из поиска попадают на 404.
  • Страницы, на которые ссылаются много внутренних ссылок — значит, они были важной частью структуры.

Средний приоритет:

  • Страницы с небольшим количеством внутренних ссылок.
  • Старые статьи или товары, которые были удалены осознанно.

Низкий приоритет:

  • URL, которые никогда не существовали (мусорные ссылки, результат сканирования JavaScript).
  • URL с опечатками, которые не приносили трафика.

Шаг 5. Выберите способ обработки для каждого URL

Для каждого битого URL доступно несколько вариантов обработки:

Вариант 1: 301-редирект на релевантную страницу. Лучший вариант, если на сайте есть страница с похожим содержанием. Удалили статью «SEO-аудит для интернет-магазина» — перенаправьте на общую статью про SEO-аудит. Удалили товар — на категорию, в которой он был. Редирект сохраняет ссылочный вес и направляет пользователей на полезную страницу.

Вариант 2: восстановление страницы. Если страница была удалена ошибочно или её контент по-прежнему актуален, верните её. Проверьте веб-архив (web.archive.org) — возможно, там сохранилась последняя версия контента.

Вариант 3: оставить 404, но убрать ссылки. Если для битого URL нет релевантной замены и восстанавливать его не нужно, удалите все внутренние ссылки, которые на него ведут. URL останётся 404, но робот не будет натыкаться на него при обходе сайта.

Вариант 4: 410 Gone. Код 410 сообщает роботу, что страница удалена навсегда и возвращать её не планируется. В отличие от 404 («не найдено»), 410 — однозначный сигнал, и поисковик быстрее уберёт URL из индекса. Используйте для страниц, которые точно не будут восстановлены.

Шаг 6. Настройте 301-редиректы

Для массовой настройки редиректов в WordPress удобно использовать плагин Redirection или настроить правила в .htaccess напрямую.

Через .htaccess (Apache):

RewriteEngine On
RewriteRule ^staraya-stranica/$ /novaya-stranica/ [R=301,L]
RewriteRule ^udalenniy-tovar/$ /kategoriya/ [R=301,L]

Через Nginx:

location = /staraya-stranica/ {
    return 301 /novaya-stranica/;
}

При большом количестве редиректов (сотни и тысячи) используйте RewriteMap в Apache или map-директиву в Nginx — они работают эффективнее, чем множество отдельных правил.

Шаг 7. Создайте полезную кастомную 404-страницу

Даже при идеальной работе с редиректами на сайте всегда останутся случаи, когда пользователь попадает на несуществующую страницу: набрал URL с ошибкой, перешёл по устаревшей закладке, нашёл старую ссылку в другом источнике. Кастомная 404-страница смягчает ситуацию.

Что должно быть на хорошей 404-странице:

  • Понятное сообщение: «Страница не найдена» — без технического жаргона.
  • Поиск по сайту: дайте возможность найти нужную информацию.
  • Ссылки на основные разделы: главная, каталог, услуги, контакты.
  • Ссылки на популярные страницы: топ-5 самых посещаемых страниц сайта.
  • Навигация сайта (меню): стандартные шапка и подвал, чтобы пользователь мог перейти в любой раздел.

В WordPress создайте файл 404.php в папке дочерней темы. Убедитесь, что страница отдаёт HTTP-код 404 (WordPress делает это автоматически через файл 404.php), а не 200 — иначе поисковик проиндексирует её как обычную страницу.

Шаг 8. Удалите битые внутренние ссылки

После настройки редиректов обновите внутренние ссылки на сайте. Даже с 301-редиректом прямая ссылка на актуальный URL лучше, чем ссылка через перенаправление. Пройдите по списку страниц-источников (столбец Inlinks из Screaming Frog) и замените старые URL на новые.

В WordPress для массовой замены URL в контенте используйте плагин Better Search Replace: задайте старый URL, новый URL — плагин найдёт и заменит все вхождения в базе данных. Перед запуском сделайте резервную копию базы.

Типичные ошибки

  • Редиректить все 404 на главную страницу. Это не решение проблемы, а маскировка. Поисковики относятся к массовому редиректу на главную как к мягкой 404-ошибке (soft 404) и могут игнорировать такие перенаправления. Редирект должен вести на релевантную страницу.
  • Не проверять, что 404-страница реально отдаёт код 404. Некоторые темы WordPress и плагины отображают кастомную страницу ошибки, но с кодом ответа 200. Для поисковика это обычная страница с пустым контентом — и она попадёт в индекс как мусор.
  • Исправлять только ошибки из GSC, игнорируя Вебмастер. Данные в GSC и Вебмастере различаются. Проблемы, которые видит Яндекс, могут отсутствовать в Google и наоборот. Проверяйте оба источника.
  • Не обновлять внутренние ссылки после настройки редиректов. Редирект — это костыль. Правильная ссылка ведёт на конечный URL напрямую. Чем меньше редиректов обрабатывает робот при сканировании, тем лучше.
  • Удалять страницы без настройки редиректа. Каждый раз, когда удаляете страницу с сайта, сразу настройте 301-редирект на ближайшую релевантную страницу. Это должно стать привычкой.
  • Не проверять внешние исходящие ссылки. Битые ссылки на другие сайты ухудшают пользовательский опыт. Если ресурс, на который вы ссылались, перестал существовать — удалите ссылку или замените на актуальную.

Что проверить в итоге

  • Сканирование Screaming Frog не выявляет внутренних ссылок, ведущих на страницы с кодом 404.
  • В Яндекс Вебмастере раздел «Исключённые» → «Ошибка HTTP: 404» не содержит страниц, которые должны быть доступны.
  • В Google Search Console отчёт «Страницы» → «Не найдено (404)» обработан: критические URL перенаправлены, остальные — осознанно оставлены.
  • Для всех удалённых страниц, имевших внешние ссылки, настроены 301-редиректы на релевантные страницы.
  • На сайте создана кастомная 404-страница с навигацией, поиском и ссылками на основные разделы.
  • Кастомная 404-страница отдаёт HTTP-код 404, а не 200.
  • Внутренние ссылки обновлены: старые URL заменены на актуальные.
  • Битые внешние исходящие ссылки обновлены или удалены.
  • Настроен регулярный процесс: проверка 404-ошибок не реже одного раза в месяц.

Нужна помощь с внедрением?

Проведу аудит вашего сайта и внедрю рекомендации. Результат — чистая техническая база и план роста.

Обсудить проект

Кто ведёт проект

Александр Тригуб — частный SEO-специалист. В поисковом маркетинге с 2010 года, предприниматель с 2001-го. В SEO пришёл из собственного бизнеса — знаю, как устроены продажи не из учебников, а из собственной выручки и расходов.

  • Специализация: медицина, B2B, e-commerce и локальные услуги — ниши, где каждый лид стоит дорого.
  • Подтверждённый опыт: 500+ видео-аудитов в разных тематиках, 1092 заказа (рейтинг 4.9 / 5). Отзывы · Видео-аудиты.
  • Профили с отзывами: 728 отзывов на Kwork (4.9★) · Profi.ru (5.0★) · ORCID 0009-0009-0106-6136.
  • Формат: работаю напрямую, один специалист на проект — без менеджеров и субподрядных цепочек.
  • Отчётность: KPI по лидам и деньгам. Ежемесячный план/факт, а не PDF на 50 страниц.
15+лет в маркетинге
500+видео-аудитов
1092заказов
4.9★728 отзывов