Анализ контекстной рекламы

Как работает кластеризация запросов

И зачем запросы кластеризовать.

Анализ эффективности запросов в контексте — один из важнейших оптимизационных отчетов. Но без дополнительной обработки, данные о запросах применимы только для пополнения списка минус-слов и вычленения новых словоформ из автотаргетинга / широких соответствий в ручные настройки.

Проблема данных о запросах в контекстной рекламе кроется в их глубокой микросегментации.

Почему микросегментация — не всегда хорошо

Мы получаем табличные данные вида "запрос - клики - конверсии - стоимость". Количество кликов в длинных запросах невелико. Например, для запроса "хороший аллерголог в Москве для ребенка 5-ти лет" клик с рекламы может быть единственным за выбранный отчетный период, а самих запросов подобного плана, но с незначительными смысловыми отличиями может быть несколько тысяч на рекламную кампанию.

В конечном итоге мы имеем множество значений с данными, которых очевидно мало для объективных выводов контекстолога. Мы видим, что с определенного запроса произошло 2 клика и 1 конверсия. С другого — 3 клика и 0 конверсий. С третьего — 1 клик и 1 конверсия.

Поверхностно, кажется, что второй запрос в списке неэффективен, но насколько этот вывод достоверен — для хоть какого-то анализа и правильных выводов хотелось бы иметь в пуле сотню кликов и более.

Выход в кластеризации

Для решения этой проблемы и существует кластеризация запросов (иными словами — их объединение в смысловые группы с определенными наборами признаков). Проводить ее вручную бессмысленно, т.к. работа требует систематичного повторения однотипных действий и колоссальных трудозатрат. Собственно, никто таким процессом и не будет заниматься руками.

В нашей практике мы используем алгоритмы кластеризации, позволяющие любой поисковой запрос привести к единому знаменателю. Наше решение реализовано внутри фреймворка IAB, и применяется в работе с каждым из наших клиентов.

Логика кластеризации проста. Приведем пример. Например, возьмем приведенный выше запрос "хороший аллерголог в Москве для ребенка 5-ти лет" .
В рамках кластеризации его можно представить в следующем формате: "аллергология - детство - Москва - прямой запрос", в такому же кластеру отнесется запрос "записать ребенка дошкольного возраста к аллергологу в Москве". Итого, уже несколько запросов объединены в одну группу, которую уже намного проще и правильнее анализировать.

Как работает кластеризация запросов

В качестве языка для написания скрипта мы применили Python. Он прекрасно подходит для обработки табличных данных. В алгоритме применены таблицы с предобучением.

Сам процесс предобучения реализован вручную. То есть, для клиента мы готовим разметочный словарь значений на основе поступающих данных. Перед первым запуском системы на аккаунте клиента производится довольно масштабная работа, но с последующими донастройками системы, корректировок и наполнения словарей с данными уже почти не требуется.

В отчетный период мы загружаем в систему информацию о поисковых запросах контекстной рекламы. Данные соотносятся с имеющимися терминами в словарях значений и собираются в кластеры по найденным признакам.

Ну а неразмеченные запросы попадают в отдельный лист, который уходит на обучение имеющейся системы кластеризации.

Что нам это дает


  • Тысячи запросов теперь объединены в несколько десятков удобных для анализа кластеров;

  • Мы теперь точно видим объем реальных целевых запросов и их результат;

  • Аналогично, мы видим объем нецелевых запросов и их результат.

На основе полученных данных со значимым для анализа объемом цифр уже реально делать правильные выводы, искать взаимосвязи результата, как с настройками рекламных кампаний, так и с посадочными страницами, делать колоссальный объем полезных изменений в аккаунтах с меньшим расходом ресурсов.

Важно понимать, что работа с контекстом — всегда про объемы и результат если и не на больших, то уж точно не на единичных, или разрозненных данных. Углубление в детали важно, но работа крупными мазками (оптимизация кампаний от кластеризации) дает условные 80% результата при 20% затрачиваемых усилий.


Если остались вопросы

Свяжемся с вами вотсап.