Как проверить посещаемость чужого блога: подробное руководство
Основные алгоритмы кластеризации ключевых запросов

Важнейший этап работы для достижения этой цели — кластеризация поисковых запросов. В этой статье я расскажу о том, как провести кластеризацию ключевых запросов.
2. Зачем делать кластеризацию?
3. Какие есть методы кластеризации?
3.1. Сервисы для кластеризации
5. Принципы и алгоритмы кластеризации
5.1. Принципы кластеризации
5.2. Алгоритмы кластеризации:
- Кластеризация по топу
- Кластеризация по словоформе
- Кластеризация вопрос / не вопрос
Заключение
Что такое кластеризация?
В результате сбора запросов пользователей по интересующей теме получается список ключей, который может состоять как из 200, так и из 10 000 позиций. Изначально собранная статистика группируется по убывающей частоте запросов, то есть от общих к более частным.
Кластеризацию проводят для того, чтобы в дальнейшем упростить создание полезного контента. Таким образом, сортировка запросов является завершающим и важнейшим этапом работы с семантическим ядром.
Зачем делать кластеризацию?
К примеру, у нас есть следующий набор ключей:
1. купить квартиру
2. арендовать квартиру
3. сдать квартиру
…
24. купить трехкомнатную квартиру
…
35. арендовать однокомнатную квартиру
…
41. сдать комнату в квартире
…
Чтобы все пользователи, которые хотят купить квартиру (одно-, двух-, трех- и более) попали на страницу, посвященной покупке недвижимости, все запросы со словом «купить» должны быть сгруппированы в один кластер:
1. купить квартиру
24. купить трехкомнатную квартиру
То же самое касается тех запросов, в которых пользователи хотят сдать или арендовать жилье.
Цель кластеризации — привести всех пользователей, которые ищут однотипный объект, на ту страницу, где этот объект представлен — т. е. определить, какие запросы могут продвигаться на одной странице.
Какие есть методы кластеризации?
Сервисы для кластеризации
Есть множество сервисов для автоматической кластеризации. Например, простой Excel, но он не достаточно точный и сложно масштабируемый, Serpstat — вариант поудобнее. Существуют и другие сервисы для автоматической кластеризации запросов, однако мы не будем упоминать их и разберем эти два варианта.
Excel
Алгоритм кластеризации в Excel:
- Загружаем все ключевые запросы.
- Формируем кластер — выделяем основные запросов с максимальной частотой.
- Сортируем все остальные ключи в сформированные кластеры.

Serpstat
- Группировка осуществляется по иерархическому принципу — фразы объединяются в кластеры, которые объединяются в более крупные группы (суперкластеры), которые, в свою очередь, объединяются в протокластеры.
- В отличие от аналогичных сервисов, Serpstat позволяет устанавливать силу связи между фразами как отдельный параметр. В зависимости от того, какую силу связи задаст пользователь — сильную, среднюю или слабую, каждая фраза будет ранжирована определенным образом, что отразится на результате группировки.
- Учитывая, что, помимо силы связи, кластеризация может быть проведена в одном из двух стандартных режимах — Hard и Soft — программа предусматривает 6 вариантов алгоритмов, что является рекордом и уникальной особенностью среди аналогичных сервисов.
- В отличие от большинства других сервисов, использующих при кластеризации топ-10, Serpstat анализирует топ-30, что, безусловно, позволяет провести группировку более точно.
![]() |
![]() |

Принципы и алгоритмы кластеризации
Принципы кластеризации
- Целевое ограничение.
- Предметное разделение.
- Дифференциация коммерческих и информационных запросов.
Предметное разделение предполагает, что однотипные объекты должны дробиться на минимально возможные сегменты. Под однотипными объектами понимаются предметы одного ряда, например: «автонавесы», «односкатные автонавесы», «двускатные автонавесы», «арочные автонавесы», «автонавесы из поликарбоната». Посетители, которые ищут «односкатные автонавесы» должны попадать на целевую страницу, а не на «двускатные автонавесы».
Сегментация запросов на коммерческие и информационные — важный принцип кластеризации, из которого есть и исключение. Например, ключи «как пьют кофе в Колумбии» и «где купить кофе из Колумбии» не должны быть сгруппированы в одном кластере. Только если ответы на оба вопроса не будут даны на одной странице, что, как правильно, нецелесообразно, но в некоторых случаях возможно.
Алгоритмы кластеризации
Для определения смысловой и семантической принадлежности фраз программы пользуются алгоритмами поисковых систем, анализируя состав топовой выдачи. Программа отправляет запросы, например «корм для пожилых собак» и «корм для взрослых собак», и получает в ответ две принципиально разные выдачи.
Вывод: эти ключи принадлежат к разным кластерам. В то же время выдача по запросам «корм для взрослых собак» и «корм для пожилых собак», скорее всего, будет совпадать, то есть эти ключи относятся к одному кластеру. Таким образом проверяется каждый запрос.
Смысловая и семантическая взаимосвязь может иметь разную степень силы. В алгоритмах этот параметр определяет характер группировки, которая может быть 2 видов: Soft и Hard. В первом варианте объединению подлежат все запросы, которые имеют в выдаче определенное количество (выставляемый параметр) совпадений URL с выдачей по основной фразе.
Во втором — для отнесения к одному кластеру выдача по каждому запросу, помимо схожести с основным, должна иметь совпадения URL (от 3 до 5) с выдачей по каждому сравниваемому запросу.

Группировка на основе словоформы предполагает отнесение фраз в одну группу, если слова, входящие в них, имеют одни и те же корни. Например, запросы «норма лейкоцитов в крови у мужчин» и «нормальные лейкоциты в крови у мужчин» принадлежат к одному кластеру, так как содержат только однокоренные слова.
Целесообразность разделения запросов на вопросительные и повествовательные имеется только в том случае, если вопросительных ключей действительно много и они могут быть сгруппированы на отдельных страницах (без повествовательных запросов).
В большинстве случаях такой метод не является предпочтительным, так как пользователи формулируют запросы по одной теме как вопросительно, так и повествовательно: например, «как заменить кран на кухне» и «замена крана на кухне».
Проблемы кластеризации запросов
Последнее особенно актуально при работе с сайтами на узкоспециализированные темы, которые недостаточно раскрыты и отражены в интернете. Например, если мы кластеризируем запросы по пшенице, то ключи, включающие сорта (которых более 30), останутся несгруппированными, так как ни поисковик, ни тем более программный алгоритм не в состоянии оценить их ценность и предметную принадлежность.
Кроме того, следует учитывать, что поисковые алгоритмы постоянно меняются и являются чрезвычайно чувствительными сами по себе. Топ сегодня и через месяц будет отличаться, а это значит, что и деление на кластеры, и их наполнение, проведенные в разное время, будут вариативными.
Заключение
Рекомендуемые статьи
Кейсы, лайфхаки, исследования и полезные статьи
Не успеваешь следить за новостями? Не беда! Наш любимый редактор Анастасия подберет материалы, которые точно помогут в работе. Присоединяйся к уютному комьюнити :)
Нажимая кнопку, ты соглашаешься с нашей политикой конфиденциальности.
Комментарии