Дублированный контент: что это и как исправить
Дублированный контент — одинаковые тексты на нескольких URL. Вызывает SEO-проблемы: поисковик не знает какую версию показывать и делит ссылочный вес.
Что такое дублированный контент
Дублированный контент — ситуация, когда идентичный или очень похожий контент доступен по нескольким URL-адресам. Это одна из наиболее распространённых технических SEO-проблем.
Пример дублирования:
https://example.com/page
https://www.example.com/page
https://example.com/page/
https://example.com/page?source=newsletter
Все четыре URL содержат одинаковый контент — это дубли.
Почему дублированный контент вреден
Когда Google находит несколько версий одной страницы:
- Не знает какую версию показывать в поиске
- Разделяет ссылочный вес между дублями
- Тратит crawl budget на обход повторяющихся страниц
- Может выбрать для отображения «неправильную» версию
В редких случаях при явной манипуляции Google применяет санкции, но чаще просто снижается эффективность SEO.
Типичные источники дублирования
Технические дубли
http://vshttps://wwwvs безwww- С trailing slash vs без (
/pagevs/page/) - Параметры URL (
?page=1,?sort=price,?utm_source=...) - Session IDs в URL
Контентные дубли
- Одинаковые товары в нескольких категориях
- Печатные версии страниц
- Региональные версии с минимальными отличиями
- Синдицированный контент (перепубликация чужих статей)
Методы устранения дубликатов
1. Canonical тег
Основной метод — указать «главную» версию:
<!-- На всех вариантах страницы указываем на каноническую -->
<link rel="canonical" href="https://example.com/page">
2. 301 редирект
Для технических дублей — перенаправление на основной URL:
# www → без www
server {
server_name www.example.com;
return 301 https://example.com$request_uri;
}
# http → https
server {
listen 80;
return 301 https://$host$request_uri;
}
3. Noindex для дублей
Если canonical неприменим:
<meta name="robots" content="noindex">
4. URL-параметры в Google Search Console
Укажите Google как обрабатывать параметры сортировки и фильтрации.
Проверка дублей на reChecker
Используйте Canonical Checker для проверки настройки canonical тегов. Инструмент покажет:
- Наличие и корректность canonical тега
- Совпадение canonical с текущим URL
- Конфликты между meta canonical и HTTP заголовком
FAQ
Перефразированный контент — это дубль? Нет. Google определяет дублированный контент по высокому уровню сходства текста. Уникально переработанный контент — не дубль. «Спинтинг» (автоматическая перефразировка) обычно обнаруживается.
Дублирование между сайтами (external duplication)? Если ваш контент перепубликован на другом сайте, используйте canonical или потребуйте удаления. Google обычно определяет оригинальный источник, но лучше застраховаться.
Нужно ли беспокоиться о небольшом сайте? На небольшом сайте дублирование менее критично. Но технические дубли (www/без www, http/https) стоит устранить даже для маленького ресурса.
Попробуйте инструмент
Проверьте дублированный контент на вашем сайте с помощью бесплатного инструмента.
Canonical Checker →