Как рассчитать вероятность конверсий, если статистики слишком мало. Инструкция для начинающих
Все любят красивую статистику, когда можно, опираясь на цифры, сказать: «Да,
Почему без прогноза конверсии не обойтись
В таких ситуациях, естественно, нужно копать глубже, до уровня групп объявлений и ключевых слов. Но если в семантическом ядре много низкочастотных фраз, то с высокой долей вероятности выяснится: вы тратите деньги на клики, а проверить целесообразность расходов не можете. Ведь каждая отдельная ключевая фраза привлекает лишь несколько кликов и конверсий, и для корректного расчета коэффициента конверсии (CR) обычно не хватает данных.
В качестве примера такой нехватки данных можно взять статистику одного из проектов нашего агентства. Для наглядности мы сгруппировали ключевые фразы по количеству полученных кликов и для каждой группы рассчитали фактический коэффициент конверсии.
Если взять общую статистику по проекту, то в среднем мы получаем одну конверсию на 52 клика (CR составляет 1,93%). При этом больше половины рекламного бюджета тратится на первую и вторую группы ключевых фраз, по которым мы не можем подсчитать фактический CR из-за недостатка данных о кликах и конверсиях. Кроме того, статистика многих ключей из третьей и четвертой групп также может оказаться нерепрезентативной. Ведь даже у ключевой фразы, получившей много кликов, может оказаться слишком мало (или совсем не быть) конверсий для того, чтобы судить о ее эффективности.
Теперь представим, что у нас есть CR для каждого из ключевых слов в аккаунте. В этом случае мы можем назначать ставки исходя из заданных KPI. А значит, снизить расходы на фразы, по которым KPI предположительно не будут выполняться, и перенаправить бюджет на потенциально более успешные ключевые слова.
Вернемся к нашему проекту. KPI по нему выполняются, клиент всем доволен, но это вовсе не значит, что ставки не требуют оптимизации. Мы рассчитали прогноз конверсии для каждого из ключевых слов. Затем разделили все ключи на 10 групп таким образом, чтобы на каждую из них приходилось примерно 10% от общего числа кликов. Для всех групп добавили данные о расходах и доходах – и получили вот такую занимательную диаграмму.
Легко заметить, что ключевые слова из группы с самым низким прогнозом конверсии приносят меньше всего денег, а ключи из группы с наиболее высоким – самые доходные. Если же посмотреть на зеленые столбцы, становится понятно, что расходы на каждую группу держатся в рамках 10%. Таким образом, доля рекламных расходов (ДРР) явно выше в тех группах, где прогноз конверсии низкий.
Что из этого следует? Что ставки необходимо скорректировать таким образом, чтобы расходы на каждую из групп примерно соответствовали доходу, который она приносит. Для этого нужно минимизировать затраты в группах с низким прогнозом конверсии и перераспределить бюджет в пользу потенциально более эффективных ключевых фраз. Результатом будет уменьшение показателя ДРР по проекту в целом.
Добавить в заметки чтобы посмотреть позже?Немного теории
Посмотрим, как происходит расчет прогноза CR – сначала в теории, а потом на конкретном примере. Сразу оговоримся, что в статье рассматривается наиболее тривиальный метод вычисления прогнозируемой конверсии (существуют автоматизированные методы с более сложной математикой, которые обычно используются в оптимизаторах конверсий, но о них мы здесь говорить не будем).
В первую очередь нам нужно разобраться с понятием сущности. Сущность – это любой элемент, для которого мы можем собирать и анализировать статистику (то есть группировка в случае Яндекс.Метрики и параметр в Google Analytics). Применительно к интернет-рекламе сущностями будут:
- аккаунт (высшая сущность);
- кампания;
- группа объявлений;
- группа ключевых слов, собранных по определенному признаку;
- объявление;
- элемент объявления (текст, заголовок, посадочная страница и т. д.);
- ключевое слово (низшая сущность).
Это распределение условно, и вы вольны использовать или не использовать любые сущности из приведенного списка. Важно лишь понимать, что их иерархия определяется количеством агрегированной статистики. У высшей сущности статистики больше всего, в то время как для низших сущностей доступен лишь небольшой объем данных.
При расчете вероятности конверсии мы будем использовать метод многоуровневого пулинга. Он предполагает, что если данных по какой-либо сущности недостаточно, то используются данные по более высокой сущности. Например, если для прогноза CR не хватает данных по ключевым словам (низшей сущности), то можно взять статистику по группе объявлений (сущности уровнем выше), в которую эти ключевые слова входят.
В обобщенном виде формула прогноза коэффициента конверсии выглядит так:
В формулу подставляются данные о кликах и конверсиях для текущей сущности и CR – для высшей, а также степень пулинга (А). Степень пулинга указывает на степень однородности сущностей, которыми мы оперируем (ключевых слов, групп объявлений, кампаний и так далее). В нашем случае А = 1.
Чтобы получить прогноз конверсии для ключевых слов, нужно подставить в формулу клики и конверсии по ключевой фразе, для которой у нас слишком мало данных, и CR по группе объявлений.
Если вы захотите больше узнать про многоуровневый пулинг и другие методы расчета вероятности конверсии, то легко найдете в рунете развернутые статьи на эту тему. Теория прогноза конверсий объясняется в них очень подробно, хоть и довольно сложным языком формул и доказательств.
Проверяем на практике
Представим, что мы рекламируем интернет-магазин мягких игрушек, в котором продаются плюшевые слоны и еноты. В семантическом ядре 16 ключевых фраз, распределенных между двумя кампаниями («Слоны» и «Еноты»).
Поскольку пример вымышленный, значения кликов и конверсий подобраны так, чтобы охватить разные ситуации:
- достаточно кликов – достаточно конверсий;
- достаточно кликов – нет/мало конверсий;
- мало кликов – много конверсий (по отношению к кликам);
- мало кликов – нет/мало конверсий.
В первых двух ситуациях можно определить эффективность ключевых фраз, подсчитав фактический CR. В третьей и четвертой ситуациях коэффициент конверсии может кардинально поменяться, как только число кликов вырастет.
Чтобы получить прогноз коэффициента конверсии для ключевых слов, мы должны рассчитать CR (фактический или прогнозируемый) для каждой сущности, находящейся выше в иерархии.
Первая итерация (аккаунт ––> кампания)
Начнем с высшей сущности – аккаунта. Чтобы убедиться, что формула работает, рассчитаем прогноз коэффициента конверсии для кампании «Слоны» и сравним полученный результат с фактическим CR.
Подставим в нашу формулу количество кликов и конверсий текущей сущности (кампании), а также CR сущности выше (аккаунта). Как видим, прогнозируемый коэффициент конверсии оказался равен фактическому CR (минимальное расхождение между прогнозным и фактическим показателями скрадывает округление до сотых процента).
Вторая итерация (кампания ––> признаки)
Переходим к следующей сущности в иерархии. Если вы используете структуру аккаунта «1 группа – 1 ключ», то выбирать в качестве следующей сущности группу объявлений нет никакого смысла, но всегда можно разделить ключевые фразы по признакам. Выбирая признаки для кластеризации, нужно учитывать намерения пользователя (что побуждает его вводить тот или иной запрос) и примерно понимать, на каком этапе воронки продаж он находится.
В зависимости от ситуации семантическое ядро можно сегментировать по:
- наличию ключевой характеристики («генератор 5 квт», «ДГУ 10 киловатт»);
- наличию слов, придающих запросу коммерческий оттенок («купить», «заказать», «цена», «прайс» и т. д.);
- наличию географических элементов («в москве», «метро аэропорт», «ул ленина»);
- запросы в форме вопроса;
- и другим признакам.
В нашем случае ключевые слова будут делиться по двум признакам: указание на цвет игрушки и наличие слов с коммерческим оттенком («купить», «заказать» и прочих).
При отборе по признакам некоторые фразы обычно попадают сразу в несколько «корзин» (даже в нашем коротком списке есть, к примеру, запросы «стоимость розового слоника» и «купить зеленого енота»). Чтобы решить эту проблему, необходимо объединить все столбцы с признаками в один («Все признаки»). Сводную статистику из этого столбца уже можно использовать в качестве текущей сущности.
Подставив в формулу количество кликов и конверсий для группы признаков (текущая сущность) и CR кампании (сущность выше), мы получаем прогнозные коэффициенты конверсии. Самостоятельной ценности эти показатели не имеют, но очень пригодятся нам на следующем этапе расчетов.
Третья итерация (признаки ––> ключевое слово)
Кульминация! Наконец-то мы можем получить прогноз CR для каждой из ключевых фраз. Подставляем в формулу количество кликов и конверсий по ключевой фразе (текущая сущность) и прогнозируемый CR уникальной группы признаков (сущность выше), в которую эта фраза входит.
Рис. 12. Прогнозные значения CR для ключевых фраз
Как видно из таблицы выше, прогнозы коэффициента конверсии «сглаживают» аномально высокие CR у ключевых фраз с небольшим количеством кликов. Например, у запроса «алешка слоник» прогнозируемые 10,05% явно ближе к истине, нежели фактический коэффициент конверсии в 75%, рассчитанный на основе всего четырех кликов. Полученную прогнозируемую конверсию мы можем использовать при расчете базовых ставок или их оптимизации.
Вместо заключения
Прогнозные значения CR, полученные таким методом, всегда будут иметь некоторую погрешность. Но даже такой прогноз – куда лучше, чем его полное отсутствие. Погрешность в прогнозах всегда будет, но ее нужно минимизировать.
Подсчет прогноза конверсии, описанный в статье, можно выполнить с помощью Excel или Power BI, однако для крупных проектов это займет слишком много времени. Если вы хотите улучшить эффективность вашей рекламы, лучшим решением будут стратегии назначения ставок на основе конверсий в Яндекс.Директе и Google Ads, а также сторонние оптимизаторы конверсий. Работа всех этих инструментов автоматизирована, поэтому, если вы решили их использовать, контролируйте изменения эффективности рекламы и не стесняйтесь обращаться в поддержку сервисов за помощью или советом.