Все об интернет-маркетинге
из первых рук
Подписаться на рассылку подписаться
на рассылку
нас уже
111 527

Мастер-класс: учимся уживаться с алгоритмом Google "Пингвином"

Мы ведем наш дайджест с 2012 года, и обладаем главной базой приемов по продвижению интернет-проектов.

В прошлой статье вы могли прочитать рекомендации о том, что делать, если продвигаемый сайт попал под действие нового алгоритма Google "Пингвин". Сегодня мы расскажем, какие ссылки Пингвин" считает плохими, выявим качественные характеристики хороших доноров и рассмотрим, как правильно выстроить стратегию продвижения сайта в новых условиях.

В ходе исследования нашими специалистами были проанализированы купленные в сервисе ROOKEE ссылки для двух типов проектов:

  • проекты, которые в период с 15-го апреля по 10 мая показали положительную динамику в поисковой системе Google;
  • проекты, которые в период с 15-го апреля по 10 мая показали отрицательную динамику в поисковой системе Google;

Всего было проанализировано порядка 40 000 проектов, продвигающихся в системе ROOKEE под Google, более 600 000 ключевых фраз и 30 000 000 ссылок, что позволяет говорить о репрезентативности полученной выборки. Полученные ссылки мы разделили на 4 группы: высокоэффективные, эффективные, средней эффективности и неэффективные. Анализ проходил в несколько этапов:

  • исследование ссылок;
  • изучение доноров (уникальных доменов), на которых размещены ссылки.

В ходе проведенного кластерного анализа ссылок нам удалось выявить основные характеристики, которые отличают эффективных и неэффективных доноров.


Кластерный анализ, или как «Пингвин» Google отличает плохие ссылки от хороших


Статистический анализ данных, посредством методов машинного обучения, позволил выделить 4 кластера ссылок с последующей валидацией полученных данных:

  • Cluster 1 — ссылки с высоким показателем эффективности;
  • Cluster 2 — эффективные ссылки;
  • Cluster 3 — ссылки средней эффективности;
  • Cluster 4 — неэффективные ссылки (как показал анализ, изначально эта группа ссылок удовлетворяла высоким критериям, однако качество страниц доноров имеет свойство ухудшаться).

Данные ссылки были разделены на кластеры согласно следующим критериям эффективности: скорость выведения запроса в ТОП, уровень вложенности страницы донора и таких показателей, как PR и тИЦ. Для идентификации "хороших" доноров мы проанализировали ссылки, проставленные на сайты, позиции которых с 15-го апреля по 10 мая показали положительную динамику. В ходе анализа мы выявили основные показатели качества доноров (PR главной страницы, PR страницы донора, уровень вложенности страницы, количество внешних ссылок на странице):

как «Пингвин» Google отличает плохие ссылки от хороших

Рис. 1. Основные показатели ссылок проектов, позиции которых показали положительную динамику

Было установлено, что у сайтов, позиции которых по запросам росли, количество ссылок из Cluster 1 и Cluster 2 (наиболее эффективные доноры) составило 35-40%:

как «Пингвин» Google отличает плохие ссылки от хороших

Рис. 2 Распределение ссылок проектов, позиции которых показали положительную динамику

Отметим, что отличительными чертами наиболее эффективных ссылок (Cluster 1 и Cluster 2) являлись высокий показатель PR главной страницы (на уровне 2-5 пункта), PR страницы донора (на уровне 1- 4 пункта) и средний уровень вложенности, который доходил до третьего уровня включительно. 

Анализ ссылочной массы сайтов, позиции которых с 15-го апреля по 10 мая показали отрицательную динамику, помог выявить ряд отличий. Ниже представлены основные показатели ссылок у проектов, позиции которых в рассматриваемый период времени показывали отрицательную динамику (PR главной страницы, PR страницы донора, уровень вложенности страницы, количество внешних ссылок на странице):

как «Пингвин» Google отличает плохие ссылки от хороших

Рис. 3 Основные показатели ссылок проектов, позиции которых показали отрицательную динамику 

Стоит отметить, что доноры из Cluster 4 имеют очень высокий уровень вложенности страницы, более низкий уровень PR страницы донора и, по мнению алгоритма Google «Пингвин», не имеют "веса";. Концентрация доноров этого кластера у сайтов, позиции которых с 15-го апреля по 10 мая показали отрицательную динамику, достаточно высока и составляет порядка 67% от ссылочной массы. Концентрация хороших ссылок из Cluster 1 и Cluster 2 менее 30%:

как «Пингвин» Google отличает плохие ссылки от хороших

Рис. 4. Распределение ссылок проектов, позиции которых показали отрицательную динамику

Сравнительный анализ рисунков 1 и 3 также выявляет существенные различия между донорами по параметру Page Rank. Обратите внимание, что успешные проекты имеют PR донора на отметке порядка 2 — Cluster 1 и Cluster 2, в то время как Cluster 3 и 4 в группе неуспешных проектов имеют PR=0. Столь очевидное расхождение в величинах также является существенным признаком дифференциации сайтов технологией "Пингвин".

Особо хотелось бы обратить внимание на тот факт, что в результате исследования влияние параметра внешних ссылок на странице на результативность продвижения / подверженность алгоритму Google "Пингвин" не выявлено. Существующие в настоящий момент слухи среди SEO-специалистов в отношении этого параметра несостоятельны.

Также в процессе выполнения кластерного анализа был выявлен ряд второстепенных показателей, оказывающих значимое влияние на качество ссылочной массы. Сопоставление второстепенных показателей приведено на рисунке 5:

как «Пингвин» Google отличает плохие ссылки от хороших

Рис. 5.1 Второстепенные показатели ссылок проектов, показавших положительную динамику

как «Пингвин» Google отличает плохие ссылки от хороших

Рис. 5.2 Второстепенные показатели ссылок проектов, показавших отрицательную динамику

Перечислим только основные из них:

  • возраст домена;
  • количество страниц в индексе Google;
  • количество страниц в индексе Яндекса.

Сопоставление графиков на рисунках 5.1 и 5.2 наглядно показывает различие между выборками успешных и неуспешных проектов по параметру "возраст домена". Это наиболее сильный из второстепенных признаков.

Интересна ситуация с параметрами "количество страниц в индексе "Google" и "количество страниц в индексе "Яндекса". Из представленных гистограмм очевидна их высокая корреляция, более того, они близки и по значениям. Это указывает на схожий характер интерпретации этих характеристик и одновременно на отсутствие их дифференцирующего влияния на ранжирование сайтов-акцепторов. Немного выделяется разве что выборка на рис. 5.1 в 3 и 4 кластерах. Эти значения можно рассматривать как минимально допустимые.


Типы анкоров


В ходе исследования нами также были проанализированы типы анкоров. Нами было выявлено, что у ссылок, чьи позиции показали отрицательную динамику, процент точного вхождения продвигаемых фраз в анкоры составил от 50% до 70%. У сайтов, показавших положительную динамику, процент точного вхождения продвигаемых фраз в анкоры составляет не более 40%. Стоит отметить, что подросшие сайты в большей степени использовали безанкорные тексты ссылок. Процент таких ссылок составил до 40% от общего количества использовавшихся анкоров (рис. 6-8).

как «Пингвин» Google отличает плохие ссылки от хороших

как «Пингвин» Google отличает плохие ссылки от хороших

как «Пингвин» Google отличает плохие ссылки от хороших

Таким образом, выявленное процентное соотношение безанкорных текстов ссылок и текстов ссылок, содержащих точное вхождение запроса, подтвердило ранее выдвинутую гипотезу западных seo-специалистов.


Выводы


Результаты проведённого исследования показывают, что алгоритм Google "Пингвин" — это, прежде всего, некая технологическая надстройка над текущим алгоритмом ранжирования, призванная карать и наказывать за "накрутку позиций" через ссылочное продвижение. При этом действует она очень избирательно и осторожно. Тот факт, что появление "Пингвин" в рунете всколыхнуло такую волну негодования, намекает лишь на качество тех ресурсов, продвижением которых занимаются специалисты.

Подведём итоги всем нашим аналитическим выкладкам. По графикам на рисунках 1 и 2 можно заметить, что по параметру "уровень вложенности страницы" группа успешных проектов независимо от кластера имеет значения этого параметра, практически равные значениям в группе неуспешных (рис. 2). Только для 4-го кластера в группе неуспешных обнаруживается "шип" — резкий всплеск по глубине вложенности. Это позволяет сделать вывод, что назначением "Пингвина" является не изменение приоритетов в ранжировании, а обнаружение и пессимизация лишь определённых групп сайтов с характерными сильными отрицательными признаками. Одним из таких сильных признаков, как нам удалось установить, является "уровень вложенности страницы". Однако этот признак не является единственным, подвергаемым анализу со стороны технологии "Пингвин". Другой обнаруженный сильный признак — "PR страницы донора".

Помимо сильных признаков, были обнаружены второстепенные, слабые признаки, тем не менее также оказывающие значимое влияние на результативность продвижения. На рисунке 5 приведено наглядное сопоставление слабых признаков.

Хотим обратить особое внимание читателей на следующие параметры: "возраст домена, "количество страниц в индексе Яндекса", "количество страниц в индексе Google". Кстати, остаётся открытым любопытный вопрос — так кто же за кем подсматривает? :)

Исходя из результатов проведенного исследования, можно сделать вывод, что при продвижении под Google стоит уделять особое внимание анализу ссылочной массы

Анализ структуры анкоров ссылочной массы также дал интересное наблюдение — точное вхождение текста запроса действительно оказывает сильное негативное влияние на результаты продвижения. 


Рекомендации:


  • не используйте для продвижения страницы с уровнем вложенности более 6;
  • не покупайте ссылки на страницах с PR менее 1, оптимально — от 2;
  • настоятельно не рекомендуем злоупотреблять точными вхождениями текста запроса в анкоры — ограничивайте долю таких текстов.

В настоящий момент в ROOKEE полностью актуализированы настройки white-листов и стратегии продвижения запросов под Google. Это позволит пользователям сервиса сохранить эффективность продвижения в поисковой системе Google, несмотря на агрессию "Пингвина".

Удачного продвижения!




Комментарии (3)

Алексей 21.03.2013
Считаю, что это самая лучшая статья за полгода. Хотя бы, потому что у меня нету базы в 40000 сайтов для анализа :)

Геннадий 22.03.2013
Вроде как полезно. Но графики понять трезвым невозможно.

seoonly.ru 29.06.2014
Отвратительный фильтр*( Много сайтов покосил зараза

Добавление комментария:

CAPTCHA

Статьи выпуска: