Загрузка...
Загрузка...
Типичные ошибки sitemap.xml: неверный формат, битые ссылки, 404, лишние URL. Диагностика и пошаговое исправление.
Типичные ошибки в robots.txt, приводящие к потере индексации и трафика. Как избежать и исправить.
SEOПошаговая настройка sitemap.xml в WordPress с Yoast SEO и Rank Math. Включение и исключение типов контента, индексы, отправка в Search Console.
SEOРуководство по созданию sitemap.xml: онлайн-генераторы, плагины для CMS, ручная генерация. Формат, лимиты и отправка в поисковые системы.
SEOПодробное руководство по созданию, настройке и оптимизации sitemap.xml. Лучшие практики для различных типов сайтов, автоматизация и мониторинг. Практические примеры для веб-разработчиков и SEO-специалистов.
Поделитесь с коллегами или изучите другие материалы блога
Ошибки в sitemap.xml могут замедлить индексацию или привести к тому, что поисковые системы перестанут его обрабатывать. В этой статье — типичные ошибки, как их диагностировать и исправить.
| Тип | Влияние | Решение |
|---|---|---|
| Синтаксис XML | Sitemap не парсится | Исправить разметку |
| Неверный URL | Отдельные URL пропускаются | Проверить формат loc |
| 404 в sitemap | Доверие к sitemap падает | Удалить или исправить URL |
| Превышение лимитов | Часть URL не обрабатывается | Разбить на несколько sitemap |
| Смешанный протокол | Ошибки в некоторых системах | Использовать только https:// |
| URL в robots.txt disallow | Противоречие | Убрать из sitemap или из disallow |
<!-- Неправильно -->
<?xml version="1.0"?>
<!-- Правильно -->
<?xml version="1.0" encoding="UTF-8"?>
Указывайте encoding="UTF-8" и сохраняйте файл в UTF-8.
В <loc> запрещены символы &, <, >, ", '. Их нужно экранировать:
<!-- Неправильно -->
<loc>https://example.com/page?foo=1&bar=2</loc>
<!-- Правильно -->
<loc>https://example.com/page?foo=1&bar=2</loc>
Каждый <url> должен содержать только один <loc>. Закрывающие теги обязательны.
<!-- Правильная структура -->
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/</loc>
<lastmod>2026-03-07</lastmod>
</url>
</urlset>
<!-- Неправильно -->
<loc>/page/</loc>
<loc>example.com/page/</loc>
<!-- Правильно -->
<loc>https://example.com/page/</loc>
Все URL должны быть абсолютными, с протоколом https://.
Если URL из sitemap отдаёт 404, поисковик теряет доверие к файлу. Действия:
В sitemap должны быть только канонические URL. Если страница переехала (301), в sitemap указывайте новый URL, не старый.
Не включайте в sitemap URL с ?session_id=, ?utm_ и подобными параметрами, создающими дубли. Используйте канонические URL.
Разбейте на несколько sitemap и создайте индекс:
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://example.com/sitemap-1.xml</loc>
</sitemap>
<sitemap>
<loc>https://example.com/sitemap-2.xml</loc>
</sitemap>
</sitemapindex>
Если URL в sitemap попадает под Disallow в robots.txt, возникает противоречие. Поисковики по-разному обрабатывают это: некоторые индексируют, некоторые нет.
Рекомендация: не включать в sitemap URL, закрытые в robots.txt. Либо открыть их для индексации, если страницы должны быть в поиске.
Формат lastmod: YYYY-MM-DD или YYYY-MM-DDThh:mm:ss+00:00.
<!-- Неправильно -->
<lastmod>07.03.2026</lastmod>
<lastmod>2026-3-7</lastmod>
<!-- Правильно -->
<lastmod>2026-03-07</lastmod>
Неточный lastmod не критичен, но может влиять на приоритет обхода. Лучше не указывать lastmod, чем указывать неверно.
Проверка доступности
Откройте URL sitemap в браузере. Должен отдаваться XML с 200 OK.
Валидация XML
Проверка sitemap reChecker — синтаксис, структура, битые ссылки.
Проверка URL
Выборочно откройте 10–20 URL из sitemap. Все должны отдавать 200.
Search Console
Раздел «Файлы Sitemap» — смотреть отчёт об ошибках и количество обнаруженных URL.
Технический аудит
Полная проверка сайта reChecker — выявит проблемы sitemap в контексте всего сайта.
| Проверка | Действие |
|---|---|
| Кодировка UTF-8 | Добавить в объявление XML, пересохранить файл |
| Абсолютные URL | Заменить относительные на полные с https:// |
| Экранирование | Заменить & на & в URL |
| 404 в sitemap | Удалить или исправить URL |
| Более 50 000 URL | Создать sitemap index |
| Файл > 50 МБ | Разбить на части или сжать |
| Конфликт с robots | Убрать из sitemap или из disallow |
Sitemap index может содержать ошибки: ссылки на несуществующие sitemap (404), циклические ссылки, неверный формат дочерних sitemap. Проверяйте каждый URL в индексе на доступность. Google ограничивает 50 000 sitemap в одном индексе.
Если сервер при проверке sitemap отдаёт 500 или 503, поисковик может временно перестать обрабатывать файл. Устраните ошибки сервера, проверьте нагрузку, при необходимости настройте кэширование sitemap.
Search Console показывает «Не удалось получить sitemap». Проверьте доступность по URL, отсутствие редиректов, корректность XML. Убедитесь, что robots.txt не блокирует путь. Используйте инструмент sitemap reChecker.
Сколько времени на исправление? После исправления поисковики обработают sitemap при следующем обходе — обычно 1–7 дней. Можно запросить переобход в Search Console.
Нужно ли удалять из sitemap страницы с 301? Да. В sitemap должны быть только финальные URL. Указывайте целевой URL редиректа.
Ошибки в sitemap снижают эффективность индексации. Проверяйте формат XML, используйте только абсолютные валидные URL, удаляйте 404, соблюдайте лимиты. Используйте проверку sitemap и технический аудит на reChecker для диагностики. Дополнительно — руководство по оптимизации sitemap.