Зачем нужна XML-карта сайта
XML Sitemap — это файл, который перечисляет все важные страницы сайта в формате, понятном поисковым роботам. Без карты сайта робот вынужден находить страницы самостоятельно, переходя по внутренним ссылкам. Если какая-то страница слабо связана с остальными или появилась недавно, робот может обнаружить ее через недели.
Карта сайта решает эту проблему: она явно сообщает поисковику, какие URL существуют, когда они обновлялись последний раз, и с какой периодичностью менялись. Для сайтов с десятками и сотнями страниц это обязательный элемент технической оптимизации.
Пошаговая инструкция
Шаг 1. Сгенерируйте карту сайта через Yoast SEO
Если на сайте установлен Yoast SEO (а я рекомендую именно его для WordPress), карта сайта создается автоматически. Проверьте: перейдите по адресу https://ваш-сайт.ru/sitemap_index.xml. Вы должны увидеть XML-файл со ссылками на вложенные карты: для записей, страниц, категорий.
Если файл не открывается, зайдите в панель WordPress: SEO → Общие → Возможности. Убедитесь, что переключатель «XML-карты сайта» активирован. После включения карта сгенерируется автоматически.
Шаг 2. Проверьте содержимое карты
Откройте sitemap_index.xml и пройдитесь по каждой вложенной карте. Проверьте следующее:
- Все важные страницы присутствуют. Главная, страницы услуг, статьи блога, категории — все должно быть в карте.
- Нет служебных страниц. Страницы вроде /cart/, /my-account/, страницы благодарности после форм — им не место в карте сайта.
- Нет страниц с noindex. Если вы закрыли страницу от индексации через мета-тег, она не должна быть в Sitemap. Yoast обычно исключает такие страницы автоматически, но проверить стоит.
- Даты lastmod актуальны. Если все страницы показывают одну и ту же дату — что-то работает неправильно. Дата должна соответствовать реальному последнему обновлению.
Шаг 3. Проверьте валидность XML
Карта сайта должна быть валидным XML-документом. Даже один лишний символ или незакрытый тег может сделать файл нечитаемым для робота. Проверить можно несколькими способами:
- Откройте файл в браузере. Если браузер показывает древовидную структуру — XML валиден. Если видите сообщение об ошибке парсинга — есть проблема.
- Используйте валидатор XML, например,
xmlvalidation.com. - Проверьте в Яндекс Вебмастере (об этом ниже) — он покажет ошибки при загрузке.
Шаг 4. Отправьте карту в Яндекс Вебмастер
Зайдите в Яндекс Вебмастер → Индексирование → Файлы Sitemap. Нажмите «Добавить Sitemap» и введите полный URL: https://ваш-сайт.ru/sitemap_index.xml. Через несколько часов Яндекс обработает файл и покажет статистику:
- Сколько URL обнаружено в карте.
- Сколько из них добавлено в базу.
- Есть ли ошибки в файле.
Обратите внимание на расхождение между количеством URL в карте и количеством проиндексированных страниц. Большой разрыв говорит о проблемах с качеством контента или техническими ошибками.
Шаг 5. Отправьте карту в Google Search Console
Откройте Google Search Console → Файлы Sitemap (в левом меню). Введите путь к карте сайта (обычно достаточно sitemap_index.xml) и нажмите «Отправить». Google обработает файл и покажет статус: «Выполнено» или «Есть ошибки».
После отправки перейдите в раздел «Покрытие» (Страницы). Здесь видно, сколько страниц из карты проиндексировано, а сколько исключено и по каким причинам. Это один из самых информативных отчетов для диагностики проблем.
Шаг 6. Укажите карту в robots.txt
Добавьте в robots.txt директиву:
Sitemap: https://ваш-сайт.ru/sitemap_index.xml
Это дублирующий способ сообщить роботам о карте сайта. Некоторые краулеры, помимо Яндекса и Google, ориентируются именно на robots.txt для поиска Sitemap.
Шаг 7. Настройте мониторинг
Карта сайта — не статичный файл. Она должна обновляться при добавлении новых страниц и удалении старых. Yoast SEO обновляет карту автоматически, но периодически проверяйте:
- Раз в месяц открывайте sitemap_index.xml и убедитесь, что новые страницы появились.
- Следите за отчетом покрытия в Google Search Console — там видны тренды индексации.
- В Яндекс Вебмастере проверяйте раздел «Страницы в поиске» — количество должно расти по мере добавления контента.
Типичные ошибки
- Страницы с 404 в карте сайта. Если вы удалили страницу, но она осталась в Sitemap — это сигнал поисковику, что на сайте беспорядок. Yoast обычно убирает такие страницы, но при ручном редактировании карты легко забыть.
- Редиректы в карте. Все URL в Sitemap должны отдавать код 200. Если страница переехала на новый адрес через 301 редирект, в карте должен быть конечный URL, а не старый.
- Слишком много URL. Один файл Sitemap поддерживает до 50 000 URL. Если у вас больше, нужно несколько файлов и индексный файл (sitemap_index.xml). Yoast делает это автоматически, разбивая карту на блоки.
- Карта не обновляется. Бывает после миграции или смены плагина: карта создана один раз и больше не обновляется. Новые статьи не попадают в файл, и роботы о них не узнают.
- Дублирование HTTP и HTTPS версий. Все URL в карте должны использовать тот же протокол, что и основное зеркало. Если сайт работает на HTTPS, в Sitemap не должно быть ни одного HTTP-адреса.
Что проверить в итоге
- Файл sitemap_index.xml открывается по прямой ссылке и содержит валидный XML.
- Все важные страницы сайта присутствуют в карте.
- В карте нет страниц с noindex, редиректов и несуществующих URL.
- Карта отправлена и принята в Яндекс Вебмастере — статус «Загружен, без ошибок».
- Карта отправлена и принята в Google Search Console — статус «Выполнено».
- В robots.txt указана директива Sitemap с правильным URL.
- Количество страниц в индексе примерно соответствует количеству URL в карте.