Serpstat использует файлы cookie для обеспечения работоспособности сервиса, улучшения навигации, предоставления возможности связаться с командой поддержки, а также маркетинговых активностей Serpstat.

Нажав кнопку "Принять и продолжить", вы соглашаетесь с Политики конфиденциальности

Принять и продолжить

Сообщить об ошибке

Отменить
10618 93 7
SEO Читать 10 минут 7 ноября 2018

Основные алгоритмы кластеризации ключевых запросов

Основные алгоритмы кластеризации ключевых запросов
Иллюстрация: Наталья Сорока

Александр Белицкий
Любой сайт создается с целью привлечения аудитории. Для того, чтобы получить целевой трафик, необходимо так продумать структуру, чтобы пользователи приходили на нужные им страницы, на которых они находили бы ответы на свои вопросы.

Важнейший этап работы для достижения этой цели — кластеризация поисковых запросов. В этой статье я расскажу о том, как провести кластеризацию ключевых запросов.
Содержание:
1. Что такое кластеризация?
2. Зачем делать кластеризацию?
3. Какие есть методы кластеризации?
3.1. Сервисы для кластеризации
5. Принципы и алгоритмы кластеризации
5.1. Принципы кластеризации
5.2. Алгоритмы кластеризации:
  • Кластеризация по топу
  • Кластеризация по словоформе
  • Кластеризация вопрос / не вопрос
6. Проблемы кластеризации запросов
Заключение

Что такое кластеризация?

Кластеризация — это разделение списка ключевых запросов на группы (кластеры).

В результате сбора запросов пользователей по интересующей теме получается список ключей, который может состоять как из 200, так и из 10 000 позиций. Изначально собранная статистика группируется по убывающей частоте запросов, то есть от общих к более частным.

Кластеризацию проводят для того, чтобы в дальнейшем упростить создание полезного контента. Таким образом, сортировка запросов является завершающим и важнейшим этапом работы с семантическим ядром.

Зачем делать кластеризацию?

Объем семантического ядра зависит от масштабности проекта. Большой объем ключевых фраз нужно отсортировать и перегруппировать — так появятся крупные блоки тем, которые интересуют пользователей. Крупные блоки делятся на более мелкие и в результате кластеризации вместо бесконечного списка фраз мы получаем дерево запросов.

К примеру, у нас есть следующий набор ключей:

1. купить квартиру
2. арендовать квартиру
3. сдать квартиру

24. купить трехкомнатную квартиру

35. арендовать однокомнатную квартиру

41. сдать комнату в квартире



Чтобы все пользователи, которые хотят купить квартиру (одно-, двух-, трех- и более) попали на страницу, посвященной покупке недвижимости, все запросы со словом «купить» должны быть сгруппированы в один кластер:

1. купить квартиру
24. купить трехкомнатную квартиру


То же самое касается тех запросов, в которых пользователи хотят сдать или арендовать жилье.

Цель кластеризации — привести всех пользователей, которые ищут однотипный объект, на ту страницу, где этот объект представлен — т. е. определить, какие запросы могут продвигаться на одной странице.

Какие есть методы кластеризации?

Группировку по кластерам можно делать вручную (если запросов немного) или автоматически. В последнем случае человек все равно должен будет принять участие, так как в результате автоматической кластеризации часть запросов останется неотсортированной (запросы с ошибками, не входящие ни в одну из полученных групп).

Сервисы для кластеризации

Автоматическая кластеризация с помощью специальных программ обладает преимуществом перед ручным способом — не только из-за высокой скорости обработки, но и потому, что такие сервисы учитывают поисковую выдачу и фактор конкуренции. Кроме того, функционал этих программ включает не только группировку ключей, но и первичный сбор семантического ядра.

Есть множество сервисов для автоматической кластеризации. Например, простой Excel, но он не достаточно точный и сложно масштабируемый, Serpstat — вариант поудобнее. Существуют и другие сервисы для автоматической кластеризации запросов, однако мы не будем упоминать их и разберем эти два варианта.

Excel

Excel удобен для ручной кластеризации ключей, т.к. он позволяет делать сортировку и автоматически высчитывать общую частотность запросов в кластере.

Алгоритм кластеризации в Excel:

  1. Загружаем все ключевые запросы.
  2. Формируем кластер — выделяем основные запросов с максимальной частотой.
  3. Сортируем все остальные ключи в сформированные кластеры.

Используйте для кластеризации Excel, если вы хорошо знакомы с тематикой сайта и если количество запросов не превышает 100.
Используйте для кластеризации Excel, если вы хорошо знакомы с тематикой сайта и если количество запросов не превышает 100

Serpstat

Serpstat — мощный и многофункциональный инструмент. Кластеризация в Serpstat уникальна и обладает следующими особенностями:

  1. Группировка осуществляется по иерархическому принципу — фразы объединяются в кластеры, которые объединяются в более крупные группы (суперкластеры), которые, в свою очередь, объединяются в протокластеры.

  2. В отличие от аналогичных сервисов, Serpstat позволяет устанавливать силу связи между фразами как отдельный параметр. В зависимости от того, какую силу связи задаст пользователь — сильную, среднюю или слабую, каждая фраза будет ранжирована определенным образом, что отразится на результате группировки.

  3. Учитывая, что, помимо силы связи, кластеризация может быть проведена в одном из двух стандартных режимах — Hard и Soft — программа предусматривает 6 вариантов алгоритмов, что является рекордом и уникальной особенностью среди аналогичных сервисов.

  4. В отличие от большинства других сервисов, использующих при кластеризации топ-10, Serpstat анализирует топ-30, что, безусловно, позволяет провести группировку более точно.
Serpstat — мощный и многофункциональный инструмент Кластеризация в Serpstat уникальна и обладает следующими особенностями
Помимо онлайн-сервиса, существует также специальное приложение для браузера Google Chrome:
Помимо онлайн-сервиса, существует также специальное приложение для браузера Google Chrome

Принципы и алгоритмы кластеризации

Проводится ли кластеризация вручную или программно, ее задача — посадка пользователей на целевую страницу. Иными словами — мы должны разделить пользователей на группы и каждой группе показать то, что ей требуется.

Принципы кластеризации

Группировка запросов проводится на основе следующих принципов:

  1. Целевое ограничение.
  2. Предметное разделение.
  3. Дифференциация коммерческих и информационных запросов.

Под целевым ограничением понимается то, что в одной группе ключей должны быть собраны запросы пользователей, объединенные одной целью. Например, «купить золотые часы» и «купить часы Hublot» можно разнести в разные группы, даже несмотря на то, что в ассортименте Hublot есть золотые часы.

Предметное разделение предполагает, что однотипные объекты должны дробиться на минимально возможные сегменты. Под однотипными объектами понимаются предметы одного ряда, например: «автонавесы», «односкатные автонавесы», «двускатные автонавесы», «арочные автонавесы», «автонавесы из поликарбоната». Посетители, которые ищут «односкатные автонавесы» должны попадать на целевую страницу, а не на «двускатные автонавесы».

Сегментация запросов на коммерческие и информационные — важный принцип кластеризации, из которого есть и исключение. Например, ключи «как пьют кофе в Колумбии» и «где купить кофе из Колумбии» не должны быть сгруппированы в одном кластере. Только если ответы на оба вопроса не будут даны на одной странице, что, как правильно, нецелесообразно, но в некоторых случаях возможно.

Алгоритмы кластеризации

Существует несколько алгоритмов кластеризации ключевых запросов:
1
Кластеризация по топу.

Для определения смысловой и семантической принадлежности фраз программы пользуются алгоритмами поисковых систем, анализируя состав топовой выдачи. Программа отправляет запросы, например «корм для пожилых собак» и «корм для взрослых собак», и получает в ответ две принципиально разные выдачи.

Вывод: эти ключи принадлежат к разным кластерам. В то же время выдача по запросам «корм для взрослых собак» и «корм для пожилых собак», скорее всего, будет совпадать, то есть эти ключи относятся к одному кластеру. Таким образом проверяется каждый запрос.

Смысловая и семантическая взаимосвязь может иметь разную степень силы. В алгоритмах этот параметр определяет характер группировки, которая может быть 2 видов: Soft и Hard. В первом варианте объединению подлежат все запросы, которые имеют в выдаче определенное количество (выставляемый параметр) совпадений URL с выдачей по основной фразе.

Во втором — для отнесения к одному кластеру выдача по каждому запросу, помимо схожести с основным, должна иметь совпадения URL (от 3 до 5) с выдачей по каждому сравниваемому запросу.
Кластеризация по топу
2
Кластеризация по словоформе.

Группировка на основе словоформы предполагает отнесение фраз в одну группу, если слова, входящие в них, имеют одни и те же корни. Например, запросы «норма лейкоцитов в крови у мужчин» и «нормальные лейкоциты в крови у мужчин» принадлежат к одному кластеру, так как содержат только однокоренные слова.
3
Кластеризация вопрос / не вопрос.

Целесообразность разделения запросов на вопросительные и повествовательные имеется только в том случае, если вопросительных ключей действительно много и они могут быть сгруппированы на отдельных страницах (без повествовательных запросов).

В большинстве случаях такой метод не является предпочтительным, так как пользователи формулируют запросы по одной теме как вопросительно, так и повествовательно: например, «как заменить кран на кухне» и «замена крана на кухне».

Проблемы кластеризации запросов

Группировка запросов не является сверхсложной задачей, особенно учитывая возможности современных программ. Единственная возможная проблема — список ключей, которые не были автоматически отнесены ни к одной из групп. Количество таких запросов в некоторых случаях может доходить до 30% от всех. Машинные алгоритмы помогают, но без приложения собственного ума и рук все же не обойтись.

Последнее особенно актуально при работе с сайтами на узкоспециализированные темы, которые недостаточно раскрыты и отражены в интернете. Например, если мы кластеризируем запросы по пшенице, то ключи, включающие сорта (которых более 30), останутся несгруппированными, так как ни поисковик, ни тем более программный алгоритм не в состоянии оценить их ценность и предметную принадлежность.

Кроме того, следует учитывать, что поисковые алгоритмы постоянно меняются и являются чрезвычайно чувствительными сами по себе. Топ сегодня и через месяц будет отличаться, а это значит, что и деление на кластеры, и их наполнение, проведенные в разное время, будут вариативными.

Заключение

Подведем итог:
1
Кластеризация поисковых запросов — обязательный этап работы над семантикой сайта, позволяющий разделить будущих посетителей на группы и создать сайт, максимально отвечающий на запросы пользователей.
2
Для автоматической группировки ключей сегодня существуют сервисы и локальных программ как платных, так и бесплатных.
3
Сервисы автоматизации не могут полностью заменить человека. Ручная корректировка требуется всегда. Вопрос лишь в том, сколько ключей останется неотсортированными: 30 или 300.

Оцените статью по 5-бальной шкале

4.16 из 5 на основе 97 оценок
Нашли ошибку? Выделите её и нажмите Ctrl + Enter, чтобы сообщить нам.

Поделитесь статьей с вашими друзьями

Войти Регистрация

Вы исчерпали лимит запросов.

Или email
Забыли пароль?
Или email
Back To Login

Не волнуйтесь! Напишите свой электронный адрес и мы пришлем вам новый пароль.

Вы уверены?

Awesome!

To complete your registration you need to enter your phone number

Назад

Мы отправили код подтверждения на ваш номер телефона

Your phone Resend code Осталось запросов

Что-то пошло не так.

Свяжитесь с нашей службой поддержки
Или подтвердите регистрацию с помощью Телеграм бота Перейдите по этой ссылке
Выберите один из проектов

Знакомство с сервисом

Ознакомьтесь с основными возможностями Serpstat удобным способом!

Отправьте заявку для ознакомления с сервисом и мы свяжемся с вами в кратчайшие сроки. Наш специалист предложит подходящий вариант, который может включать персональную демонстрацию, пробный период, материалы для обучения и повышения экспертизы, личную консультацию, а также комфортные условия для начала работы с Serpstat.

Имя

Email

Телефон

Будем рады вашему комментарию
Увеличить лимиты

Улучшить тариф

Экспорт недоступен для вашего тарифного плана. Вам необходимо улучшить свой тариф до Lite или выше, чтобы получить доступ к инструменту Подробнее

Зарегистрироваться

Спасибо, мы с вами свяжемся в ближайшее время

Пригласить
Просмотр Редактирование

E-mail
Сообщение
необязательно
E-mail
Сообщение
необязательно

У вас закончились лимиты

Вы достигли лимита на количество созданных проектов и больше не можете создавать новые проекты. Увеличьте лимиты или удалите существующие проекты.

Я хочу больше лимитов