MatrixNet (Матрикснет) Яндекса - алгоритм машинного обучения
Все об интернет-маркетинге
из первых рук
Подписаться на рассылку подписаться
на рассылку
нас уже
111 982

MatrixNet


MatrixNet (Матрикснет) Яндексаэто специальный алгоритм машинного обучения, благодаря которому поисковая система Yandex строит собственную формулу ранжирования сайтов при ответе на поисковый запрос. Впервые был анонсирован в 2009 году.

Необходимо отметить, что другие поисковики пользуются совершенно иными алгоритмами.

В интернете огромное количество web-страниц. Поисковые роботы, проходя по ссылкам, сохраняют их в свою базу данных (индекс поисковой системы). Информация обо всех сохраненных страницах хранится в специальном формате – инвертированном индексе. Алгоритм машинного обучения принимает во внимание всю эту информацию и выстраивает собственный список при ответе поисковой машины на запрос пользователя.

У поисковой системы есть специальные люди – асессоры, они отвечают за разметку сайтов. Совокупность размеченных сайтов называется обучающей выборкой. Проходя по этой выборке, MatrixNet сам формирует список параметров, отвечающих за релевантность документа запросу. Далее при ранжировании он учитывает все эти параметры с определенными весами.

Чтобы лучше понять работу алгоритма, можно провести аналогию. Например, есть два набора яблок – один содержит вкусные, другой – невкусные. Матрикснет проходя по этим яблокам, найдет неочевидные признаки, соответствующие вкусу (цвет, твердость, размер и т.д.).

Стоит отметить, что когда поисковая машина находит в своем индексе документы, соответствующие запросу, она начинает их ранжировать по убыванию релевантности. Здесь уже учитываются самые разные факторы – посещаемость сайта и страницы, входящие ссылки, польза для пользователя и другие. По утверждению сотрудников Яндекса, на данный момент подобных факторов насчитывается около 800.

Благодаря MatrixNet, релевантность выдачи Яндекса значительно увеличилась.

Машинное обучение в поисковых алгоритмах изначально начали применять еще в 2000 году, но у Матрикснета есть ряд значительных преимуществ перед аналогами. Например, он значительно устойчивее к «переобучению», т.е. он понимает, что связь между цветом шрифта и релевантностью не может оказывать значительное влияние на итоговую выдачу результатов.


A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
А Б В Г Д Е Ж З И К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Э Ю Я