новости, статьи, советы, обсуждения

Алгоритмы поисковой выдачи Яндекса

Многие используют яндекс, и даже не замечают, что его алгоритмы меняются и дорабатываются, и каждый уважающий себя сеошник пристально следит за мельчайшими изменениями этих алгоритмов.

Сегодня я бы хотел просветить “серую массу”, для которых слова типа Магадан, Находка и Анадырь лишь название городов на карте:)

Перелопатив солидную долю рунета, мне удалось добыть некоторую информацию и выстроить ее в логическую цепочку.Алгоритмы поисковой выдачи Яндекса

Начиная с 14 апреля 2008г, Яндекс решает называть свои поисковые алгоритмы названиями Российских городов (Раньше он называл их цыфрами и последний по-моему был SP8), и обещает в дальнейшем информировать пользователей об основных изменениях заранее, а также дает возможность тестировать новый алгоритм на дополнительном адресе.

16 мая 2008г. Алгоритм Магадан

Итак, долгожданный Магадан поселился на основном адресе яндекса.

Основные изменения:

Увеличино число факторов ранжирования вдвое(!!!).

Добавлены классификаторы, позволяющие лучше понять тип страницы и тип ссылок.

Изменена технология поиска так, что яндекс может быстро выбрать наиболее релевантные документы в первую очередь и не ждать поиска по остальным страницам.

Смягчили фильтрацию отбора документов для ранжирования, что привело к улучшению ранжирования по запросам, для которых релевантные документы содержат слова запроса далеко друг от друга, например, “бмв цирк колеса”.

Научился обрабатывать при поиске аббревиатуры и написания транслитом

Яндекс начал глубже понимать текст страницы и его качество.

Теперь нераздельные слова он находит нераздельно: например C++ или Европа+.

Введена стадия прюнинга. Фактически это эвристический анализ, и яндекс на этой стадии определяет релевантность документа по самым ярким признакам (скорее всего титлы и заголовки), остальные документы даже не рассматриваются. В результате сильно возрасла скорость и упала нагрузка.

Судя по отзывам пользователей у Магадана сильно ухудшилась выдача по множеству запросов. В топы полезла всякая лажа.

2 июля 2008г. Алгоритм Магадан 2.0

Основные изменения:

добавлены факторы, учитывающие уникальность контента (с этих пор ГС стали хорошенько банится)

Введен классификатор порнографии (Фактически множество сайтов соответствующей тематики вылетели из индекса, а новенькие вошли)

Введен геоклассификатор. Довольно хорошая вешь, когда ишешь что-то в своем городе.

Введен классификатор коммерционализированности. Интернет магазинами я не занимался и не могу сказать как он на них повлиял.

Об остальных факторах яндекс умалчивает.

В результате сильных изменений не возникло. Некоторые ГС-ы и сплоги пошли в бан. Тиц как обычно понизился где-то на 20-30%, и все успокоились..

11 сентября 2008г. Алгоритм Находка

Основные изменения:

Выросло качество поиска со стоп-словами

Изменился подход к машинному обучению. Теперь яндекс расширил свой словарь путем автоматического анализа имеющихся текстов.

Научился искать слова которые пишутся как раздельно, так и слитно. Например, автоваз и авто ваз.

В результате я не почувствовал изменений. Хотя у новых сайтов резко возрос траффик.

Следующая остановка алгоритм Анадырь

Ходит слух, что он был использован в этом апе, но слух пока ничем не подтвержден.

Буду рад любым мнениям об изменениях яндекса и направлении их деятельности.

 

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Антиспам:

Посетителей на сайте
Яндекс.Метрика
Опросы

Ваш стаж работы в сети?

Просмотреть результаты

Загрузка ... Загрузка ...