Для чего нам нужно знать как улучшать поведенческие факторы? Для чего нам нужна аналитика, метрики для их отслеживания? Потому что вложить кучу денег в качество сайта и его улучшение, к сожалению, этого не достаточно. Поисковики, зачастую, это ценят. Особенно Яндекс с его дурацким машинным обучением, которое лишено всякого строгого математического смысла и логики.

Совсем другое дело — это знать какие метрики измеряет поисковик, оценивать их самим и уже конкретно их улучшать.

Какие метрики (факторы) сейчас существуют?

Мы обратимся напрямую к поисковым системам и посмотрим, что они нам напрямую рассказывают про поведенческие метрики. Составим список, который будем анализировать на корреляцию с ранжированием.

Источники данных для Яндекса:

  • поисковая выдача;
  • яндекс Метрика;
  • бары и браузеры.

Из выдачи Яндекс берет данные по:

  • показам;
  • кликам;
  • порядку в рамках сессии (первый клик, последний и так далее);
  • времени в рамках сессии (до клика, после клика);
  • итогу сессии (переформулировка, уход в другую ПС, окончание сессии).

Из Метрики и баров Яндекс получает следующие данные:

  • количество;
  • источники трафика;
  • взаимодействие (время, различные активности мыши, переходы по ссылкам, заполнения форм и так далее).

На основании каких документов будем строить аналитику?

Представители Яндекса выступают часто на конференциях и делятся некоторыми наработками с профессиональным сообществом. Мы отыскали несколько документов, которые представляют интерес для seo и в которых прямо можно отыскать реальные метрики, которые есть в алгоритме ранжирования.

  1. Session-based Query Perfomance Prediction. Метрика из этого документа — поисковые сессии.
  2. Through-The-Looking Glass: Utilizing Rich Post-Search Trail Statistics for Web Search. Здесь нам интересны пользовательские сессии. То есть проведен анализ того, что делает на сайте пользователь после того как перешел из серпа.
  3. Click Model-Based Information Retrieval Metrics. Метрики на основе анализа поисковых сессий.
  4. Improving web search ranking by incorporating user behavior information. Документ западных коллег из Microsoft. Поисковые и пользовательские сессии.
  5. A Noise-aware Click Model for Web Search. Рассматриваются поисковые сессии. Тоже ребята из Майкрософта подготовили.

Важно то, что содержание, а также описание метрик очень похоже в документах подготовленных специалистами Яндекса и и его западными коллегами. Это позволяет нам более четко и однозначно смотреть на эти все вещи.

Наиболее интересные факторы, касающиеся поисковых сессий

Аббревиатура Расшифровка фактора
LCC Количество длинных кликов (более N секунд). Чем длиннее клики, тем лучше для сайта. То есть пользователь кликнул, пробыл на сайте N секунд, вернулся в выдачу и кликнул сразу на другой результат. N — может быть различен в зависимости от тематики. В докладах Яндекса фигурирует цифра в 60 секунд.
CC Количество кликов в рамках сессии
DS Среднее время пребывания на выдаче
DC Среднее время ожидания клика
AR Обрыв на сессии (некликнутые выдачи). Человек задал запрос и никуда не кликнул. По словам представителя Яндекса — этот фактор раньше имел большее влияние, чем сейчас.
PagR Доля кликов по одной из следующих страниц выдачи
Запросы с переформулировками. Это когда человек задал запрос и через короткое время задал еще один запрос или, как вариант, никуда не кликнул и ввёл новый запрос. То есть человек на получил в ТОПе что хотел и начал уточнять свой запрос.
Количество запросов в рамках 1 сессии. Чем меньше — тем лучше с точки зрения выдачи Яндекса. А это значит, что Яндекс подобрал правильные сайты в ТОП 10.
Клики по 1 позиции в выдаче. Чем больше таких кликов, тем лучше для сайта. Это значит, что Яндекс и Google поднимают на верх результат, который нравится пользователям. А если еще посетитель кликнул по этой первой позиции и больше не вернулся в выдачу, то это вообще замечательно.
pSkip Пропущенный результат. Когда пользователь кликает, к примеру, на 1 позицию и заканчивает свою сессию, а на 9 других нет, то с точки зрения ранжирования для этих 9 сайтов ничего не происходит. Ведь поиск не получает ни какой обратной связи об остальных 9 результатах ниже. И обратная ситуация, кликнул на 1 позицию, а потом на 3 позицию, пропустив 2 место, то 2 сайт — это Skip. Он получает минус в ранжировании. Пользователя он не заинтересовал.
Позиция первого клика. Она не равняется 1, потому что люди далеко не всегда кликают на первую строчку выдачи. Чем она меньше, тем лучше. Вычисляется по формуле 1/номер позиции, где случился первый клик.
Время до первого клика. Оно должно быть как можно меньше. Чем пользователь быстрее выбрал понравившийся результат, тем лучше для этого результата.
CTR Здесь нужно разделять CTR позапросный и хостовый. Отношение числа кликов к показам сниппета сайта. Очень мощный фактор ранжирования. Чем больше, тем лучше. Данные по CTR предоставляет Вебмастер Яндекса.
Запросы без кликов. Были показы, но не было кликов. Чем меньше, тем лучше. Можно посмотреть в Яндекс Вебмастере.

На самом деле метрик из этой серии — еще гораздо больше. Это следует из разного рода докладов Яндекса и Google. У Гугла так отдельная история — они официально пока что не признают существования поведенческих факторов. Но в тоже время доклады, которые есть в доступе и наблюдения говорят об обратном.

Из того, что мы можем реально сделать, чтобы как то положительно повлиять на метрики поисковых сессией — это только улучшить сниппет и заголовок, а также добавить фавиконку. Старайтесь также делать так, чтобы в сниппете было как можно больше жирных (выделенных) слов. Суть этого добиться того, чтобы на ваш сниппет кликали, как можно чаще по сравнению с конкурентами.

Вывод по фактору LCC: у большинства урлов, которые хорошо ранжируются, более 5% людей, приходящих из поиска, задерживаются на странице более 1 минуты. Для запросов должно быть не менее 10% пользователей, проводящих на странице более 1 минуты.

Отчет: Подсчет длинных кликов в Метрике

Отчет: Подсчет длинных кликов в Метрике для УРЛа

Вот так выглядит настройка отчета для подсчета фактора LCC. К сожалению, я не придумал, как это можно реализовать полностью на автомате. Если вы знаете, то пишите в комментариях ниже — я буду очень признателен. А в моем случае расчет следующий:

Мы построили 2 сегмента с периодом последний квартал. В первом сегменте непосредственно сколько посетителей пришло из яндекса на определенную страницу и провело на ней больше 1 минуты. Таких было 53. Второй сегмент подсчитал нам общее количество людей пришедших на данный урл из яндекса. И таких получилось — 377. Получаем 53/377*100%=14%>5% — а это значит, что данный фактор отрабатывает хорошо для данного урла. Значение 5% выведено опытным путем еще известным аналитиком Стасом Поломарем и оно коррелирует с хорошим ранжированием. А какой этот порог у Яндекса пока никто не знает.

Вывод по фактору CTR: для улучшения хостового CTR вам нужно искать запросы у которых много показов, но нет или очень мало кликов. По таким запросам надо удалить себя из выдачи.

Факторы, касающиеся пользовательских сессий

Здесь нам интересны следующие показатели:

  • время на странице;
  • время на хосте (среднее);
  • источники переходов;
  • глубина просмотров;
  • удовлетворенные шаги.

Удовлетворенный шаг для Яндекса — это когда пользователь пробыл на документе не менее 30 либо 60 секунд, а затем либо завершил свою сессию либо продолжил её дальше.

Все эти показатели — они не имеют четкого характера. Нельзя сказать, что если показатель отказов 15% — то это плохо или это хорошо. Надо сравнивать с конкурентами из ТОПа. Показатель отказов и глубину просмотров можно подсмотреть в Similarweb.com. А вот время там не имеет ничего общего с реальностью.

Но, на основании своего большого опыта работы с информационными проектами, могу сказать, что для их хорошего ранжирования надо стремиться к более низкому показателю отказов, более высокой глубине просмотров и более длительному нахождению пользователя на странице/сайте.

Для коммерческих проектов все сложнее и зависит сильно от тематики. Тут нет однобокого трактования и одинаковых советов.