27 июля 2017

Кластеризовали, кластеризовали, и наконец выкластеризовали: как работает наш новый инструмент


Инна Arsa
Главный редактор в Serpstat
Сегодня в разделе «Инструменты» Serpstat появился новый раздел «Кластеризация (смысловая группировка загруженных фраз) и Текстовая аналитика (рекомендации по оптимизации страницы)». Новые функции призваны облегчить работу SEO-специалистам и копирайтерам.
В этом посте я расскажу вам про кластеризацию. Что это такое и зачем это нужно? Чем наш инструмент отличается от функций других сервисов? Как с ним работать в Serpstat?

Про текстовую аналитику читайте в другой статье.

Что такое кластеризация и зачем она нужна?

Кластеризация — это разбивка фраз на группы, которые называются кластерами. Внутри каждой группы должны оказаться «похожие» фразы, а фразы из разных групп должны как можно сильнее отличаться.

Например, такие фразы, как «кефир», «iphone 6s», «iphone 7», «йогурт», «творог» и «macbook» можно разбить на следующие кластеры: {macbook}, {iphone 6s, iphone7}, {кефир, йогурт, творог}.

Кластеризация нужна для того, чтобы:

- объединить фразы по смыслу;
- провести анализ семантического ядра;
- создать группу фраз для размещения на конкретной странице;
- распределить фразы по страницам и организовать полноценную структуру сайта;
- найти не кластеризованные ключевые фразы, которые не относятся ни к одной из групп.

В чем проблема большинства сервисов кластеризации и как Serpstat решает ее?

Основная проблема большинства инструментов кластеризации в том, что они формируют все группы на основании центра кластера — высокочастотной фразы, для которой подбираются фразы со схожими результатами выдачи.

В связи с этим возникают трудности:
1
Фразы оказываются в одной группе, но при этом не имеют семантической связи между собой.
2
Создается множество маленьких кластеров, которые могли бы быть объединены в более крупный кластер.
3
Необходимо время на пробивку частотности. К тому же, такая пробивка требует дополнительных затрат и источника, который пробивает точную частотность.
Serpstat решает эти проблемы через реализацию иерархической кластеризации, при которой близкие по смыслу кластеры, объединяются в суперкластер. При этом от вас не требуется ни дополнительный сбор частотности, ни какая-либо предварительная подготовка данных — вы просто загружаете список фраз, выбираете регион и способ кластеризации.
В чем наша особенность?
Цель кластеризации в Serpstat — собрать кластеры так, чтобы все ключевики были максимально близки по тематике и не упустить из виду ни один из ключевиков.
1
Serpstat не собирает группы, отталкиваясь от самых высокочастотных фраз.
2
Мы изучаем все фразы в целом, отталкиваясь от их пересечений в SERPe.
3
У нас иерархическая структура кластеризации: фразы объединяются в группы (так называемый кластер), кластеры объединяются в группы более высокого уровня (суперкластеры), а суперкластеры объединяются в группы еще более высокого уровня (протокластеры).
4
Serpstat проверяет силу связи между всеми кластеризуемыми фразами, в зависимости от тех настроек, которые вы сами зададите.
Сила связи — количество одинаковых страниц в топ-30 результатов поиска по анализируемой ключевой фразе. Максимально возможное количество одинаковых результатов по фразам составляет 30 страниц.

Какие настройки кластеризации предлагает Serpstat?

Мы предлагаем две основные настройки: сила связи и тип кластеризации.

1) Сила связи включает два варианта — Weak/Strong

Настройка Weak говорит о слабой силе связи между фразами, Strong — о сильной связи.

Strong требует большего количества общих урлов для объединения в кластер, чем Weak. Weak сообщает системе, что для объединения в кластер фразы должны иметь меньшее количество общих URL в топ-30 результатов поиска по фразе, чем в Strong.

2) Тип кластеризации может быть Soft или Hard.

Soft сообщает инструменту кластеризации, что фразы могут быть добавлены в кластер, если хотя бы у одной пары из кластеризуемых фраз есть одинаковые URL в поиске, в зависимости от силы связи (Weak/Strong).
При выборе Hard-кластеризации, у всех фраз в одном кластере будут одинаковые URL-ы в топ-30 результатов поиска по фразе (в зависимости от выбора Weak/Strong).

Результатом кластеризации методом Hard является синонимичное и точное ядро, но большое количество кластеров, так как фразы входят в кластер только при ярко выраженной смысловой близости.
По завершении кластеризации часть фраз может оказаться в каталоге Unsorted (нераспределенные в группы). Это фразы, которые не попали ни в один кластер. Возможно, эти фразы имеют отдаленное отношение к тематике и их следует удалить из списка кластеризуемых фраз.

Альтернативное решение — создать обособленные страницы под эти фразы, либо переместить их в один из кластеров, если вы считаете, что фразы подходят создаваемому семантическому ядру.

Какой способ кластеризации выбрать?

Что выбрать Strong+Hard, Strong+Soft, Weak+Soft или Weak+Hard?

По умолчанию мы используем Soft+Weak. Но каждый для себя и в процессе работы с этим инструментом поймет, какие параметры подойдут к каждому конкретному случаю. Все зависит от однородности тематики и смысловой близости фраз, которые вы собрались кластеризовать.

Если фразы изначально близки по смыслу, например, тематика кроссовок различных брендов, то лучше выбрать параметры Strong+Hard или Strong+Soft, чтобы в кластер объединялись максимально близкие синонимы. Вы получите много кластеров, которые можно использовать под отдельные страницы или узкие категории.

В случае же разнообразных тематик и услуг, например, сбора семантического ядра для мультитоварного интернет-магазина или широкопрофильного медицинского центра, лучше выбрать кластеризацию Weak+Soft. Выбор Strong+Hard даст больше кластеров и возможность детальнее раздробить собранное ядро.
Больше о том, как устроена кластеризация в Serpstat и чем она отличается от кластеризации в других сервисах смотрите в нашем новом видео:

Сколько это стоит?

Стоимость использования «Кластеризации» включена в стоимость вашего тарифа.

  • В плане А нет возможности кластеризовать фразы.
  • План B включает 4000 ключевиков на кластеризацию.
  • План С — 12 000 фраз.
  • План D — 25 000 фраз.

Внимание! Пока инструмент находится в режиме Beta, стоит ограничение — в одном проекте нельзя группировать более 2 тыс. фраз.

Как работать с инструментом «Кластеризация»?

Читайте дальше, чтобы узнать, как настроить ключевые фразы для кластеризации и как трактовать полученные отчеты.

Настраиваем кластеризацию

1. Перейдите в раздел «Инструменты» и кликните кнопку «Открыть» в ячейке «Кластеризация и текстовая аналитика»
2. Нажмите кнопку «Создать проект»

3. Введите в полученной ячейке название проекта и домен (если собираетесь проводить текстовую аналитику по конкретному домену) нажмите «Далее»:

4. Задайте список фраз или загрузите их в окошко в файле CSV или TXT

5. Добавьте поисковую систему, страну, регион и город

6. Выберите силу связи, тип кластеризации и нажмите «Готово»

Выпейте чайку или просто отвлекитесь, фразы ушли на кластеризацию ;)
7. В результате получите примерно такую таблицу:
Где 3 — это кластер, состоящий исключительно из фраз, расположенных справа, 2 — суперкластер и 1 — протокластер.
Напомню:

Протокластер — набор суперкластеров. Как правило, в протокластер объединяются суперкластера, представляющие определенную категорию объектов.

Суперкластер — набор кластеров. Суперкластер объединяет близкие по смыслу фразы, но немного менее синонимичные, чем непосредственно фразы из кластера.
Итак, мы получили суперкластеры по аренде квартир, мониторам, макбукам, холодильникам, нижнему прессу, которые, в свою очередь, разделились на дополнительные группы — кластеры.

Разбираем кластер — полученный отчет

В окошке справа найдете список всех фраз, разделенных на группы и сводную информацию по кластеризации:
1. Каждая фраза наделена определенным значением — силой связи. Она показывает, насколько близка ключевая фраза из кластера к общей тематике кластера по шкале от 0 до 1.

2. Параметр «однородность» говорит о том, насколько связаны по тематике ключевые фразы в этом кластере (измеряется от 0 до 1).

3. По этим фразам ранжируется определенный URL. Если при создании проекта вы добавили сайт, то мы подберем из страниц этого сайта наиболее соответствующие тематике кластера. Если вы этого не сделали, то можете добавить страницу уже в этом отчете. Просто наведите на URL в отчете и появится кнопка «Редактировать».
Над каждым полученным кластером можно провести текстовую аналитику. Об этом инструменте читайте в соответствующей статье.

Обратите внимание на раскрывающееся меню в кластере:
1. Кнопка «Найти ключевые фразы» включит поиск по кластеру среди имеющихся фраз

2. С помощью кнопки «Удалить фразы» можно удалить некоторые фразы. Очевидно ;) Заранее нужны отметить их «галочкой»

3. Кнопка «Удалить подкластер» удаляет данную группу
4. При нажатии кнопки «Показать метатоп» появится список главных страниц-конкурентов в выдаче по фразам из кластера. Чем выше страница находится в метатопе, тем более релевантна она тематике данного кластера фраз.

В полученном дашборде также можно изменять название кластеров, создавать новые, открыть к просмотру все кластеры и скрыть некоторые. В общем, все для вашего удобства.

На этом всё! Попробуйте наш новый инструмент ;)
P.S. Наш математик-аналитик готовит еще более подробную статью о том, как работает кластеризация в Serpstat и в чем ее отличие от других сервисов на конкретных примерах.

Если уже сейчас у вас появилась масса вопросов, оставляйте всё-всё в комментариях, ответим в новое статье :)

Рекомендуемые статьи

Хотите узнать новые фишки по интернет-маркетингу?
Подпишитесь на нашу рассылку — только полезные статьи, реальные кейсы и новости Serpstat раз в неделю.

Комментарии

Войти Регистрация

Вы исчерпали лимит запросов.

Или email
Забыли пароль?
Или email
Нажимая "Зарегистрироваться", Вы соглашаетесь с
условиями использования Serpstat и Политика конфиденциальности
Back To Login

Не волнуйтесь! Напишите свой электронный адрес и мы пришлем вам новый пароль.

Вы уверены?

Знакомство с сервисом

Serpstat экономит время, как и мы готовы сэкономить ваше, на знакомстве с ключевыми возможностями сервиса.
Наш специалист свяжется с вами и по итогу предложит подходящий вариант, который может включать персональную демонстрацию, пробный период, обучающие статьи и записи вебинаров, консультацию специалиста, а также комфортные условия для старта использования Serpstat.

Имя
Email
Телефон
Skype или Google Hangouts
Комментарий

Увеличить лимиты

Зарегистрироваться

Спасибо, мы с вами свяжемся в ближайшее время

Пригласить
E-mail
Роль
Сообщение
необязательно

У вас закончились лимиты

Вы достигли лимита на количество созданных проектов и больше не можете создавать новые проекты. Увеличьте лимиты или удалите существующие проекты.

Я хочу больше лимитов