Алгоритмы поисковой выдачи Яндекса
Многие используют яндекс, и даже не замечают, что его алгоритмы меняются и дорабатываются, и каждый уважающий себя сеошник пристально следит за мельчайшими изменениями этих алгоритмов.
Сегодня я бы хотел просветить “серую массу”, для которых слова типа Магадан, Находка и Анадырь лишь название городов на карте:)
Перелопатив солидную долю рунета, мне удалось добыть некоторую информацию и выстроить ее в логическую цепочку.
Начиная с 14 апреля 2008г, Яндекс решает называть свои поисковые алгоритмы названиями Российских городов (Раньше он называл их цыфрами и последний по-моему был SP8), и обещает в дальнейшем информировать пользователей об основных изменениях заранее, а также дает возможность тестировать новый алгоритм на дополнительном адресе.
16 мая 2008г. Алгоритм Магадан
Итак, долгожданный Магадан поселился на основном адресе яндекса.
Основные изменения:
Увеличино число факторов ранжирования вдвое(!!!).
Добавлены классификаторы, позволяющие лучше понять тип страницы и тип ссылок.
Изменена технология поиска так, что яндекс может быстро выбрать наиболее релевантные документы в первую очередь и не ждать поиска по остальным страницам.
Смягчили фильтрацию отбора документов для ранжирования, что привело к улучшению ранжирования по запросам, для которых релевантные документы содержат слова запроса далеко друг от друга, например, “бмв цирк колеса”.
Научился обрабатывать при поиске аббревиатуры и написания транслитом
Яндекс начал глубже понимать текст страницы и его качество.
Теперь нераздельные слова он находит нераздельно: например C++ или Европа+.
Введена стадия прюнинга. Фактически это эвристический анализ, и яндекс на этой стадии определяет релевантность документа по самым ярким признакам (скорее всего титлы и заголовки), остальные документы даже не рассматриваются. В результате сильно возрасла скорость и упала нагрузка.
Судя по отзывам пользователей у Магадана сильно ухудшилась выдача по множеству запросов. В топы полезла всякая лажа.
2 июля 2008г. Алгоритм Магадан 2.0
Основные изменения:
добавлены факторы, учитывающие уникальность контента (с этих пор ГС стали хорошенько банится)
Введен классификатор порнографии (Фактически множество сайтов соответствующей тематики вылетели из индекса, а новенькие вошли)
Введен геоклассификатор. Довольно хорошая вешь, когда ишешь что-то в своем городе.
Введен классификатор коммерционализированности. Интернет магазинами я не занимался и не могу сказать как он на них повлиял.
Об остальных факторах яндекс умалчивает.
В результате сильных изменений не возникло. Некоторые ГС-ы и сплоги пошли в бан. Тиц как обычно понизился где-то на 20-30%, и все успокоились..
11 сентября 2008г. Алгоритм Находка
Основные изменения:
Выросло качество поиска со стоп-словами
Изменился подход к машинному обучению. Теперь яндекс расширил свой словарь путем автоматического анализа имеющихся текстов.
Научился искать слова которые пишутся как раздельно, так и слитно. Например, автоваз и авто ваз.
В результате я не почувствовал изменений. Хотя у новых сайтов резко возрос траффик.
Следующая остановка алгоритм Анадырь
Ходит слух, что он был использован в этом апе, но слух пока ничем не подтвержден.
Буду рад любым мнениям об изменениях яндекса и направлении их деятельности.
Добавить комментарий