Дублированный контент на одном сайте

Автор: Денис

Ни для кого не секрет, что поисковым системам не очень нравится дублированный контент. И в этом есть очень даже разумное основание.

Представьте себя на месте  робота поисковой системы (ну скажем Яндекса), который без устали день ночь “ходит” по всему Рунету и собирает информацию для поискового индекса, размер которого, кстати говоря, составляет уже не малую цифру

И тут роботу попадается страничка, которую он уже где-то видел и она уже попапала в те 94182 ГБ проиндексированной информации. Какой смысл еще раз ей засорять свой винт?

Да, если дублированный контент – это одни и те же популярные новости или законы, представленные на разных сайтах, то скорее всего страницы с ними попадут в поисковый индекс на всех этих сайтах. Но если одна и та же информация продублирована на некотором количестве страниц одного и того же сайта, то в индексе с большой вероятностью окажется лишь малая часть страниц от этого количества.

Поэтому следует избегать дублирования содержания на различных страницах одного и того же сайта!

По этой причине в Панели Вебмастера для одного моего подопечного сайта получаются вот такие вот интересные цифры

 

Т.е. робот Яндекса просмотрел целых 421 страницу, а занес в поисковый индекс всего 126. 

А теперь поймем почему так получается. 

Львиную долю этого сайта занимает каталог продукции примерно вот с такими страничками:

Которые различаются только рисунком этикетки (или другой продукции).

А теперь как это видит робот:

Различия только в названии рисунков. Ну и как Вы думаете имеет ли смысл “кушать” роботу все странички такого типа? Конечно же нет.

Как результат - ни одна из этих двух страниц не находится в индексе поисковой системы Яндекс.

А вот если бы, например, на каждой такой страничке присутствовало пару предложений уникального контента про название этикетки, для какой компании она делалась и прочее, прочее, то поисковый робот с удовольствием бы “скушал” такие страницы, и какой-нибудь пользователь, глядишь, и зашел бы по низкочастотному запросу, а потом, глядишь, и позвонил бы да и заказал что-нибудь.

Любопытно изучить:

Отзывов (35) на «Дублированный контент на одном сайте»

  1. Eugene в 13.01.2008 at 2:12 пп

    Получается, шаблонизация дизайна даже одного сайта вредит?

  2. admin в 14.01.2008 at 5:48 пп

    Не совсем, дело не в шаблонизации дизайна, а в отсутствии уникального контента. В картинку просто не вместился одинаковый контент под картинками этикеток.

    Как пример, почему блоги на Вордпрессе (в том числе и мой), прекрасно индексируются поисковыми системами, хотя дизайн у многих шаблонный.

    Или почему яндексоиды советуют наполнять сайт уникальным контентом и он появится в результатах выдачи – в том числе и по этой причине.

  3. Денис в 03.02.2008 at 4:16 пп

    Предположу, что Яндекс не поощряет дублированный контент из-за возможности массового автоматического развития сайтов держащихся только на копировании, а винт, мощности это уже дело второе.

  4. wshurik в 07.06.2008 at 11:14 дп

    Ну так да .. слова рулят, а уникальные слова рулят вдвойне.
    И надо везде где можно хоть пару ключей оставлять (что с одной стороны не гуд, но если больше написать нечего … что правда случается крайне редко)

  5. Сергей Пономарев в 12.10.2008 at 11:32 дп

    У кого-то из забугорных мастеров смотрел видео, там такая же тема освещалась.
    Но там говорилось, что пара предложений не канает, потому, что это будет очень маленький % уникальности на фоне всего контента (меню) и там говорили “пишите много”, “придумывайте описания” и т.д…

  6. Semenovich Anna в 11.12.2008 at 8:55 пп

    Уважаемый Mexboy, новые версии Вордпресса как то борются с дубликатами контента, не подскажете?
    Потому что часто случайно можно запостить одну и ту же статью несколько раз…
    Особенно глубокой ночью, когда думается тяжело:)

  7. Денис в 11.12.2008 at 9:17 пп

    Semenovich Anna, хотя я сомневаюсь, что вы действительно Анна Семенович, ну это как же должно думаться тяжело, чтобы второй раз одно и то же написать, а потом запостить :) В рамках одного и того же сайта на вордпресс не сталкивался с такой фичей

  8. Semenovich Anna в 11.12.2008 at 9:34 пп

    Просто я пользуюсь программой для постинга Windows Live Writer.
    И иногда она и САМА постит дважды, или у меня рука дрогнет:)

  9. Ефим в 22.12.2008 at 5:02 пп

    У меня один сайт за такое забанил яндекс( Теперь незнаю что и делать с ним, весь поток трафа был от туда

  10. Елена в 12.01.2009 at 12:20 пп

    а что делать если мне надо сделать такой набор страниц на сайте? неужели он не будет индексировать ни одну из страниц?

    стр.1
    ______
    текст1
    ——
    текст2
    ______

    стр.2
    ______
    текст1
    ——
    ______

    стр.3
    ______
    текст2
    ——
    ______

  11. Денис в 14.01.2009 at 4:23 пп

    Елена, может посчитать дублями, лучше разместить уникальный контент или хотя бы рерайт

  12. Елена в 14.01.2009 at 4:59 пп

    спасибо. уже нашли уникальный контент. буду знать.

  13. Hazukashii в 31.01.2009 at 9:29 дп

    Автор подскажи, сейчас повсеместно используются теги, а теги это дубли уже существующих страниц, нужно ли их закрывать к индексации через robots.txt?

  14. Денис в 31.01.2009 at 12:46 пп

    Hazukashii, скорее да, чем нет, если конечно вы не собираетесь продавать ссылки с сайта ;)

  15. Hazukashii в 01.02.2009 at 11:22 дп

    Денис, Вот именно, страницы с тегами – около 35-40% страниц и если захочется продавать ссылки, то закрытие тегов, это минус, но для нормальной индексации это плюс, вот палка о двух концах…
    Сами вы кукаю сторону выбираете?

  16. Денис в 02.02.2009 at 10:27 пп

    Hazukashii, я бы поступил так, если страниц на сайте много (тысячи – десятки тысяч), то закрыл бы теги от индексации дабы не мешать индексации основных страниц. Если страниц на сайте немного, то оставил бы теги открытыми.

    З.Ы.: Не люблю в Сапе страницы-теги покупать, уж больно часто они из индекса выпадают :)

  17. seobag в 15.02.2009 at 2:23 пп

    Google советует использовать директиву “canonical” http://seobag.ru/canonical/ для исключения дублей. Жаль, что Yandex пока не воспринимает данную инструкцию, но думаю это скоро изменится.

  18. uranix в 26.03.2009 at 8:05 дп

    Вот у меня сайт на WP вылетел. Контент состоял из картинок (обои для рабочего стола) и короткого названия этой картинки (2-3 уникальных слова из головы). Также каждая запись была включена в несколько рубрик и несколько меток. Весь сайт проиндексировался гошей и яшей включая почти все метки и рубрики. Пошел трафик. Потом (через 2 месяца) яша его выкинул из индекса. А гугл до сих пор (уже год) туда трафик нагоняет.
    сайт: pictu.ru
    Подскажите кто знает как вернуть сайт в индекс яшки?

  19. Денис в 26.03.2009 at 2:22 пп

    uranix, Платону пробовали писать?

  20. frenky_bob в 14.05.2009 at 10:32 дп

    привет! а может случиться так, что изза того что на сайте 3 одинаковых страницы, одна из этих страниц(продвигаемая) упадёт в выдаче?

  21. Денис в 14.05.2009 at 3:28 пп

    frenky_bob, угу может, обычно при этом выдаваемый урл в результатах поиска меняется

  22. Владимир в 16.05.2009 at 2:49 пп

    Ох нифига себе скока на яндекс.вебмастере полезного, а я только в гугле вебмастером пользовался.
    Читал, что странички с не уникальным контентом попадают под фильтры поисковика и не участвуют в выдаче по запросам, но у меня на сайте есть странички с не уникальным содержанием, и все они проиндексированы и из индекса не выпадают (тьфу,тьфу,тьфу), значит они все равно участвуют в выдаче?

  23. Денис в 18.05.2009 at 1:03 пп

    Владимир, приводили примеры, когда страницы проиндексированы в Яндексе, но в выдаче не участвуют. Яндекс типа считает их “плохими”, но не настолько чтобы выкидывать их из своей базы. Но это скорее исключение, так обычно да, участвуют.

  24. Александр Пофигеевич в 21.02.2010 at 5:48 пп

    Надо было в тег альт напихать по паре абзацев с описанием и робот бы скушал странички, как разные(ну мне так кажется). Я бы так сделал.

  25. vkontakte в 25.02.2010 at 3:30 пп

    На моём сайте контент уникальный, а Яндекс чё та никак не проиндексирует его( … Сколько обычно нужно времени на индексацию нового сайта? подскажите кто в курсе.

  26. AS в 28.02.2010 at 9:23 пп

    vkontakte – 2-3 апа, может больше.

  27. АндрейSoft в 27.03.2010 at 5:33 пп

    А забанить за много дублированного контента могут?

  28. Здоровый в 27.03.2010 at 7:14 пп

    —А забанить за много дублированного контента могут?
    Да могут, но здесь решает совокупность http://www.easybiznes.ru/uniq/ – здесь есть интересная теория

  29. Владимир в 28.03.2010 at 4:09 пп

    У моего знакомого Яндекс забанил, за то, что контент был бесполезным и несодержательным. Хотя всё было уникальное.

  30. АндрейSoft в 28.03.2010 at 4:59 пп

    Прямо через саппорт написали что за это забанили?

  31. Владимир в 29.03.2010 at 1:17 дп

    Да, никакие споры не помогли. Причём гугл проиндексировал всё.

  32. kinofilmi в 13.04.2010 at 7:13 пп

    Да. Eugene, шаблонизация всегда вредит. Я например беру все менюшки в ноуиндекс. Вот как это решить для гугла пока не знаю.

  33. Алексей в 21.04.2010 at 12:14 пп

    Добрый день, прошу помочь разобраться. Хочу бороться с дублированностью контента в своем интернет магазине следующим образом. Создать на странице с описанием продукта поле. (Анонсы новых статей) и в нем вставлять (случайным образом для каждой страницы) по 2-3 предложение из нескольких статей. Как могут отреагировать?

  34. Bykashka в 25.04.2010 at 1:30 дп

    Для того чтобы поисковик считал страницу уникальной, количество символов уникального контента должно, как минимум, превышать количество символов слов шаблона. Если уникального контента на странице не хватает, то нужно брать в ноиндекс. Хотя в ноиндекс всегда лучше брать некоторые пункты меню, для ускорения индексации.

  35. Денис в 26.04.2010 at 1:10 дп

    Алексей, напишите на e-mail с примером сайта, так сложно сказать, это лучше чем ничего, но все равно не гуд.

Оставьте свой комментарий