Поисковая система – не человек, но должна выдавать пользователям результаты, очень похожие на те, которые бы выбрал именно человек, а не машина. Поэтому одним из приоритетных направлений развития ранжирования является «мимикрия» под человека, встраивание в формулу ранжирования «человеческого поведения». Для этого Яндекс использует две технологии: обучение MatrixNet с помощью ручного труда асессоров, оценивающих страницы по комплексу параметров и общему впечатлению, а также поведенческие факторы – отслеживание действий реальных пользователей. О машинном обучении и MatrixNet в целом мы поговорим в одном из ближайших выпусков рассылки, а сегодня сосредоточимся на том, как Яндекс отслеживает и интерпретирует поведение пользователей. Сразу стоит отметить, что оценки асессоров являются более важным фактором ранжирования и могут «забороть» поведенческие факторы. Например, если у сниппета сайта высокая кликабельность, но асессоры ставят ресурсу низкую оценку – например, из-за «заманухи» и несоответствия на деле сути запроса, – то лидерства в выдаче уже не добиться.
Большой Брат наблюдает: источники данных
Откуда у Яндекса информация о поведении пользователей? Существует (несмотря на постоянные отрицания и уклончивые ответы представителей и сотрудников поисковика) три источника: Сбор данных с поисковой выдачи – отсюда можно получить данные по кликабельности сниппета. Очевидно, что если пользователи больше кликают по сайту, находящемуся на третьем или четвертом месте, чем по первым результатам по какому-либо запросу, то он лучше отвечает на запрос (более релевантен) и потому заслуживает перемещения выше на SERP. Также Яндекс собирает возвраты данные по возвратам к выдаче с помощью кнопки «Назад» в браузере – чем больше возвратов с сайта, тем он менее релевантен, а более соответствующим запросу будут сайты, которые завершают поиск.
Яндекс.Метрика – собственный счетчик Яндекса достаточно популярен в силу удобства, полноты предоставляемой статистики и ее хорошей визуализации, а также мощного продвижения самим Яндексом. Наивно было бы думать, что Яндекс не использует данные Метрики для присваивания сайту, где установлен счетчик, определенных параметров, влияющих на ранжирование.
Яндекс.Бар – надстройка для браузеров, которая предлагает быстрый доступ к сервисам поисковой системы и отображает полезные данные (погоду, пробки, курсы валют и так далее). Навязывается Яндексом в собственных сборках браузеров, мессенджерах и так далее, а также активно рекламируется на самом поисковике. В последних версиях появилось отслеживание местоположение пользователя по IP и Wi-Fi и, соответственно, показ поисковых результатов и прочих сервисов с максимально точным геотаргетингом. Что касается отслеживания поведения, то существуют вполне убедительные доказательства «шпионской» активности Бара. Он отслеживает и «отсылает в центр» примерно те же параметры, что и Яндекс.Метрика. Вполне очевидно, что с такими мощными средствами сбора статистики о поведении Яндекс достаточно легко может присвоить каждому мало-мальски посещаемому сайту (и даже каждой странице) коэффициенты и параметры, которые затем используются в формуле ранжирования.
Кластер страниц по дополняющим запросам
Наличие на сайте комплекса страниц, оптимизированных по дополняющему списку запросов, а также «ссылочных маршрутов» для переходов посетителей со страницы на страницу, является косвенным фактором, как бы «предваряющим» соответствующий поведенческий. Если кластер страниц под дополняющие запросы из «Статистики слов» есть, Яндекс будет считать, что сайт готов обеспечить высокие значения поведенческих метрик (продолжительность пребывания на сайте, количество просмотров страниц и т.п.) Важно понимать, что кластер запросов нужно брать именно из «Статистики слов», из колонки «Что еще искали люди». Слова в ней сортируются не по частотности, а по тому, насколько часто они являются переформулировками первоначального запроса после возвращения от посещенного сайта обратно на страницу поиска.
Основные поведенческие факторы Показатель отказов (bounce rate) – если пользователь выходит с сайта (возвращается к выдаче или закрывает вкладку браузера или сам браузер) после просмотра одной страницы, такое поведение классифицируется как «отказ». Это негативный поведенческий фактор, который свидетельствует о некачественном и нерелевантном ресурсе. Хотя в некоторых тематиках – и архитекторы веб-поиска Яндекса, вероятно, это понимают – показатель отказа не может являться критерием качества сайта, так как пользователи получают ответ на свой вопрос на первой же странице. Например, это тематика такси, где обычно главная страница сайта встречает посетителя номером телефона и примерными расценками, и ему не нужно переходить на другие страницы, чего он обычно и не делает. Сайт при этом может быть более чем качественным, даже суперпродающим. Кстати, уже в основную формулу поиска «встроена» защита от значительного изменения позиций на основе какого-либо одного фактора: поисковик принимает во внимание не просто сумму факторов с весовыми коэффициентами важности, а некую «общую картину» (так называемый «моном»), в которой целое может отличаться от арифметической суммы слагаемых.
Время, проведенное на сайте – одна из самых важных метрик. На плохом сайте человек не будет задерживаться, на хорошем – проведет достаточно много времени.
Количество просмотренных страниц (глубина просмотра) – примерно аналогичный предыдущему критерий качества сайта.
Первый и последний клики по выдаче – поисковая система считает более релевантными сайты, на которые были переходы из выдачи в первый и последний раз (если пользователь открыл сразу несколько сайтов из выдачи). Помимо основных поведенческих факторов есть и миноритарные, среди которых даже такие, как присутствие ссылок на сайт в неспамовых (!) письмах, отправленных или принятых через Яндекс.Почту. Однако это пока сугубо естественные факторы, пытаться влиять на которые преждевременно и бессмысленно. Гораздо лучше уделить время работе с уже работающими в полную силу поведенческими факторами, перечисленными выше.
Что делать? Если перечисленные показатели для продвигаемого сайта не слишком хороши, уберите Яндекс.Метрику. Не стоит явно сообщать Яндексу, что дела пока идут не так, как хотелось бы. Получать всю необходимую информацию можно и с помощью Liveinternet, а Метрику вернуть после того, как показатели выйдут на хорошие значения (bounce rate ниже 40%, более 2,5 просмотров за среднюю сессию).
Бейтесь за информативный и привлекательный сниппет. Если поисковик составил его на основе не самого удачного куска текста страницы, перепишите его, чтобы вынудить систему при переиндексации заменить сниппет. Пользуйтесь всеми инструментами управления внешним видом поисковых результатов – подробную информацию об этом можно получить в докладе Александра Шубина (Яндекс), сделанном на конференции NetPromoter-2010. Его можно посмотреть на SeoPult.TV.
Создайте кластер дополняющих страниц (см. выше).
Меняйте landing page (входную страницу) каждого продвигаемого запроса так, чтобы она действительно отвечала на запрос пользователя, была 100% релевантной.
Доведите до ума дизайн, юзабилити и контент сайта – так и только так можно замотивировать людей проводить просматривать более одной страницы и проводить на сайте достаточное количество времени.
Выводы
Поисковые системы постоянно стараются сделать выдачу более «человечной», и единственный способ, который работает для этого на 100%, – использование данных о поведении реальных людей. Эти данные у Яндекса есть, объем и инструментарии анализа наращиваются. Очевидно, что в дальнейшем роль поведенческих факторов будет только расти. Позаботьтесь о качестве своего сайта, и все будет в порядке.