Все об интернет-маркетинге
из первых рук
Подписаться на рассылку подписаться
на рассылку
нас уже
111 717

Новый алгоритм Google “Колибри”: что это за птица?

Мы ведем наш дайджест с 2012 года, и обладаем главной базой приемов по продвижению интернет-проектов.

Google во время празднования 15-летия компании в гараже, в котором были заложены основы предприятия, представил миру новый алгоритм под названием Hummingbird — “Колибри”. Похоже, Google не заменил предыдущие алгоритмы, такие как PageRank и многие другие, которые он использовал для сортировки страниц. Во время анонса нового алгоритма представители компании сообщили, что Google начал использовать Hummingbird несколько недель назад и что он охватывает 90% всех поисковых запросов.

1.jpg

Схема работы нового алгоритма

Данный алгоритм направлен на расширение запроса или расширение подхода, который поможет лучше понять длинные естественные языковые запросы, которые используются в речи вместо коротких ключевых слов запроса, которые могут быть набраны в поисковой строке.

Например, запрос, в котором алгоритм может проявить свой потенциал, выглядит так: «Самое лучшее заведение, в котором можно попробовать пиццу по-чикагски». Google может использовать синоним и правила эквивалентного запроса в сочетании с анализом других слов, не отбрасывая их в самом запросе, чтобы понять контекст термина запроса и возможную замену для него, чтобы перефразировать или поменять термины поиска и показать лучшие результаты.

Google может проанализировать запрос «Самое лучшее заведение, в котором можно попробовать пиццу по-чикагски» и понять, что пользователь ищет результаты, в которых предпочтительнее использовать слово “ресторан” вместо “заведение”.

Слово “ресторан” вместо “заведение” может рассматриваться как возможный синоним или эквивалент на основе правил замены, сфокусированных на сочетаемых условиях, которые могут появиться в результатах запроса при поиске данных условий или на сочетаемых терминах при сеансах запроса.

Анализ Google различных объектов поиска, таких как связь между запросами, может быть в некоторых случаях более подходящим для пользователя. В данном случае результаты поиска основываются на таком факторе, как длительность нахождения на странице, когда пользователь выбирает ее из списка результатов поиска.

2.jpg

Механизм анализа поисковых запросов

На этой неделе Google опубликовал патент, который основывается на трех патентах, где описывается процесс, который очень сильно напоминает алгоритм Hummingbird:

"Опознание синонимов на базе сочетаемых терминов"

Автор: Абхит А. Махабал, Такахиро Накаджима, Закари А. Гарретт, Кенджи Иноэ

Владелец: Google

Патент США номер 8.538.984

Выдан: 2013.09.17

Запатентован: 2012.04.03

Реферат: методы, системы и оборудование, включая компьютерные программы, закодированы на запоминающем средстве ЭВМ для:

  • Идентификации определенного термина запроса исходного поискового запроса;
  • Идентификации подходящего синонима для определенного термина запроса в контексте с другим несмежным термином запроса исходного поискового запроса, который не является смежным с определенным термином запроса в исходном поисковом запросе;
  • Доступа к хранимым данным, который указывает на пару терминов, включающих конкретный термин запроса и подходящий синоним конкретного термина запроса, соответствующего уровню достоверности для несмежного термина запроса;
  • Определения того, что в хранимых данных уровень достоверности несмежного термина запроса соответствует параметрам;
  • Определения пересмотра исходного поискового запроса для включения подходящего синонима конкретного термина запроса, основанного на определении, что уровень достоверности несмежного термина запроса соответствует параметрам.

В патенте говорится, что мера сочетаемости используется для оценки подходящих терминологических/синонимических пар, основанных на том, как часто эти термины (сложные слова или фразы) появляются вместе или в похожих запросах пользователя (например, в последовательных запросах в сеансе запроса) либо, как правило, показываются вместе в похожих результатах запроса.

Google может рассмотреть ряд синонимов из базы синонимичных данных, чтобы выяснить, насколько хорошо они вписываются в контекст всего запроса. Например, слова car (машина) и auto (авто) часто рассматриваются как синонимы, особенно когда они могут появиться в запросах, таких как «car mechanic» (автослесарь) и «auto mechanic» (автомеханик), но они не будут являться синонимами в контексте запроса «railroad car» (железнодорожный вагон) и «railroad auto» (железнодорожное авто).

Маловероятно, что пользователь, ищущий «railroad car», хотел бы увидеть в списке запросов «railroad auto», не говоря уже о замене. В моей статье, опубликованной ранее, говорится о том, что в правилах замены запросов для синонимов могут быть созданы аналогичные правила, и те и другие могут быть использованы для создания синонимической и эквивалентной базы данных. Такая база может содержать данные о степени уверенности, что термины могут быть синонимами или эквивалентами, в основе которых лежат сочетаемые данные, вне зависимости от того, могут ли они быть синонимами или эквивалентами, основанными на правилах с участием других терминов, которые могут быть частью этого же запроса.

3.jpg

Механизм оценки контекста поискового запроса


Почему Hummingbird?


Патент, поданный Google на рассмотрение в 2005 году, имеет много общего с нынешним патентом. Эксперт патентного ведомства описал его как родственный с патентом “Определение синонимов термина запроса в контексте запроса”. Таким образом, основные идеи расширения запроса существовали в Google в течение многих лет.

Несмотря на то, что пользователи вводят ключевые слова в поисковую строку, похоже, что при голосовом запросе они забывают о ключевых фразах. При вводе запроса в поисковую строку он будет выглядеть так: «ресторан с пиццей по-чикагски», в то время как при голосовом запросе данная фраза будет звучать так: «Самое лучшее заведение, в котором можно попробовать пиццу по-чикагски».

В патенте представлен ряд дополнительных примеров того, как слова в запросе могут быть использованы контекстуально для лучшего понимания других слов, которые могут быть заменены в данном запросе синонимами или эквивалентами.


Мнение эксперта


Андрей Канунников, руководитель отдела маркетинга сервиса Rookee:

“Изменения в технологиях взаимодействия IT-систем с человеком удивительны. Давайте посмотрим чуть шире: Alpha от Wolfram, Siri от Apple, Watson от IBM, Hummingbird от Google, Google Glass, а ещё есть Google Car, наработки Boston Dynamics и т.д. Очевиден технологический вектор на приобретение машинами способности действовать через понимание и принятие решений на основе смысловой составляющей человеческих коммуникаций. И Google здесь явно метит в лидеры с его весьма любопытным трио. Интернет для Google — не только информационная монополия и деньги, но ещё и колоссальная лаборатория. Hummingbird — это шаг навстречу смыслу. Статистикой эта проблема не решается, мы это хорошо поняли, работая над проектом babkee.ru — системой мониторинга социальных сетей, когда перед нами возникла проблема оценки тональности сообщений. Именно поэтому я активно придерживался идеи использования семантических деревьев. С точки зрения SEO, на мой взгляд, всё весьма неплохо. Расширение вариаций поисковых запросов при должном подходе со стороны SEO-компаний позволит снизить градус конкуренции по запросам, породит новые запросные ниши с невысокими ценами, существенно разнообразит тексты ссылок, увеличив релевантность донорно-акцепторных связей через обыгрывание смыслов, позволит точнее выявлять потребность человека в отношении объекта поиска, его дополнительных свойств и готовности совершить действия. Позволит предлагать более релевантные поисковые результаты. Ну и контекстные объявления”.

Вполне возможно, что алгоритм Hummingbird работает несколько иначе, чем описано в формуле изобретения и/или описании патента, но они очень похожи. Это ли патент Google Hummingbird? Как вы думаете? 

Источник: http://www.seobythesea.com/2013/09/google-hummingbird-patent/




Комментарии (15)

Geo 17.10.2013
"Идентификации подходящего синонима для определенного термина запроса в контексте с другим несмежным термином запроса исходного поискового запроса, который не является смежным с определенным термином запроса в исходном поисковом запросе" Это тоже был машинный перевод? Можно что то понять?

Михал Палыч 17.10.2013
Ни асилил

Елена 17.10.2013
Geo | 17.10.2013
"Идентификации подходящего синонима для определенного термина запроса в контексте с другим несмежным термином запроса исходного поискового запроса, который не является смежным с определенным термином запроса в исходном поисковом запросе" Это тоже был машинный перевод? Можно что то понять?
Это не автоматический перевод. Вот оригинал: identifying a candidate synonym for the particular query term in context with an other non-adjacent query term of the original search query that is not adjacent to the particular query term in the original search query, accessing stored data that specifies (см. http://all-patents.com/us-patent/8538984 - Реферат (Abstract) вторая строка) Вот что получилось при автоматическом переводе: выявление кандидата синоним для конкретного запроса термин в контексте с другими Курение на всей территории, прилегающей запрос, срок первоначального поискового запроса, что не примыкает к какому-либо запросу срок первоначального поискового запроса Получается в статье явно человечий осмысленный перевод

Олег 17.10.2013
Михал Палыч | 17.10.2013
Ни асилил
Не осилил русский язык?

Михал Палыч 17.10.2013
Олег | 17.10.2013
Михал Палыч | 17.10.2013
Ни асилил
Не осилил русский язык?
Я взглянул на картинки и мне стало лень напрягать моск.

Артур 17.10.2013
Михал Палыч | 17.10.2013
Олег | 17.10.2013
Михал Палыч | 17.10.2013
Ни асилил
Не осилил русский язык?
Я взглянул на картинки и мне стало лень напрягать моск.
Моск

Ярослав Черных 17.10.2013
Geo | 17.10.2013
"Идентификации подходящего синонима для определенного термина запроса в контексте с другим несмежным термином запроса исходного поискового запроса, который не является смежным с определенным термином запроса в исходном поисковом запросе" Это тоже был машинный перевод? Можно что то понять?
Всё проще - Гугл сейчас как бы учитывает предыдущий запрос и запоминает контекст сеанса, т.е. если вы спросили сначала: "где купить пиццу" и он порекомендовал вам ресторан, то на следующий вопрос: "как туда проехать", он вместо "туда" попробует подставить "где купить пиццу" и в итоге переформулирует в запрос типа: "как проехать туда где можно купить пиццу". Т.е. Гугл "умнеет" и учитывает о чём вы его спрашивали в предыдущем запросе и уже учитывает это при поиске.

Илья 22.10.2013
Артур | 17.10.2013
Михал Палыч | 17.10.2013
Олег | 17.10.2013
Михал Палыч | 17.10.2013
Ни асилил
Не осилил русский язык?
Я взглянул на картинки и мне стало лень напрягать моск.
Моск
О боже!.. он просто цитировал Баш...

Илья 22.10.2013
А мне нравится, как они схемки рисуют похожие на нейронные связи в человеческом мозге. Искусственный интеллект создадут как раз когда 1 млрд. таких схем нарисуют...

Geo 22.10.2013
Ярослав Черных | 17.10.2013
Geo | 17.10.2013
"Идентификации подходящего синонима для определенного термина запроса в контексте с другим несмежным термином запроса исходного поискового запроса, который не является смежным с определенным термином запроса в исходном поисковом запросе" Это тоже был машинный перевод? Можно что то понять?
Всё проще - Гугл сейчас как бы учитывает предыдущий запрос и запоминает контекст сеанса, т.е. если вы спросили сначала: "где купить пиццу" и он порекомендовал вам ресторан, то на следующий вопрос: "как туда проехать", он вместо "туда" попробует подставить "где купить пиццу" и в итоге переформулирует в запрос типа: "как проехать туда где можно купить пиццу". Т.е. Гугл "умнеет" и учитывает о чём вы его спрашивали в предыдущем запросе и уже учитывает это при поиске.
И как теперь отслеживать позиции если я продвигаю сайты в другой стране? В самом гугле это сделать невозможно? Он будет учитывать мои запросы и местоположение даже если я буду искать с чистым кешем?

Ярослав 22.10.2013
И как теперь отслеживать позиции если я продвигаю сайты в другой стране? В самом гугле это сделать невозможно? Он будет учитывать мои запросы и местоположение даже если я буду искать с чистым кешем?
Боюсь, что да. Отслеживание позиций с введением персонального, локального и интеллектуального поиска становится всё более сложным и бессмысленным. Гугл всё настойчивее загоняет всех в Adwords. Для аналитики ключевики закрыли, остались только в инструментах и адвордсе. Продвижение становится всё более социальным и близким по духу пиару.

Ярослав 09.10.2014
К сожалению, не нашёл форму отписки от комментариев. Интересно, если я все такие письма буду в гуглопочте помечать как СПАМ, она научится сама их туда отправлять?

Прожектор Rookee 10.10.2014
Ярослав | 09.10.2014
К сожалению, не нашёл форму отписки от комментариев. Интересно, если я все такие письма буду в гуглопочте помечать как СПАМ, она научится сама их туда отправлять?
Ярослав, чтобы мы могли отписать Вас от комментариев, напишите, пожалуйста, к какой статье Вы были подписаны.

Ярослав 29.11.2014
Прожектор Rookee | 10.10.2014
Ярослав | 09.10.2014
К сожалению, не нашёл форму отписки от комментариев. Интересно, если я все такие письма буду в гуглопочте помечать как СПАМ, она научится сама их туда отправлять?
Ярослав, чтобы мы могли отписать Вас от комментариев, напишите, пожалуйста, к какой статье Вы были подписаны.
К этой статье: http://prozhector.ru/publications/vypusk-38/novyy-algoritm-google-kolibri-chto-eto-za-ptitsa/

Прожектор Rookee 30.11.2014
Ярослав | 29.11.2014
Прожектор Rookee | 10.10.2014
Ярослав | 09.10.2014
К сожалению, не нашёл форму отписки от комментариев. Интересно, если я все такие письма буду в гуглопочте помечать как СПАМ, она научится сама их туда отправлять?
Ярослав, чтобы мы могли отписать Вас от комментариев, напишите, пожалуйста, к какой статье Вы были подписаны.
К этой статье: http://prozhector.ru/publications/vypusk-38/novyy-algoritm-google-kolibri-chto-eto-za-ptitsa/
Ярослав, Ваш e-mail будет отписан от комментариев.

Добавление комментария:

CAPTCHA

Статьи выпуска: