Report a bug

Cancel
15547   87   9
Новости 10 min read 27 July 2017

Кластеризовали, кластеризовали, и наконец выкластеризовали: как работает наш новый инструмент


Инна Arsa
Главный редактор в Serpstat
Сегодня в разделе «Инструменты» Serpstat появился новый раздел «Кластеризация (смысловая группировка загруженных фраз) и Текстовая аналитика (рекомендации по оптимизации страницы)». Новые функции призваны облегчить работу SEO-специалистам и копирайтерам.
В этом посте я расскажу вам про кластеризацию. Что это такое и зачем это нужно? Чем наш инструмент отличается от функций других сервисов? Как с ним работать в Serpstat?

Про текстовую аналитику читайте в другой статье.

Что такое кластеризация и зачем она нужна?

Кластеризация — это разбивка фраз на группы, которые называются кластерами. Внутри каждой группы должны оказаться «похожие» фразы, а фразы из разных групп должны как можно сильнее отличаться.

Например, такие фразы, как «кефир», «iphone 6s», «iphone 7», «йогурт», «творог» и «macbook» можно разбить на следующие кластеры: {macbook}, {iphone 6s, iphone7}, {кефир, йогурт, творог}.

Кластеризация нужна для того, чтобы:

- объединить фразы по смыслу;
- провести анализ семантического ядра;
- создать группу фраз для размещения на конкретной странице;
- распределить фразы по страницам и организовать полноценную структуру сайта;
- найти не кластеризованные ключевые фразы, которые не относятся ни к одной из групп.

В чем проблема большинства сервисов кластеризации и как Serpstat решает ее?

Основная проблема большинства инструментов кластеризации в том, что они формируют все группы на основании центра кластера — высокочастотной фразы, для которой подбираются фразы со схожими результатами выдачи.

В связи с этим возникают трудности:
1
Фразы оказываются в одной группе, но при этом не имеют семантической связи между собой.
2
Создается множество маленьких кластеров, которые могли бы быть объединены в более крупный кластер.
3
Необходимо время на пробивку частотности. К тому же, такая пробивка требует дополнительных затрат и источника, который пробивает точную частотность.
Serpstat решает эти проблемы через реализацию иерархической кластеризации, при которой близкие по смыслу кластеры, объединяются в суперкластер. При этом от вас не требуется ни дополнительный сбор частотности, ни какая-либо предварительная подготовка данных — вы просто загружаете список фраз, выбираете регион и способ кластеризации.
В чем наша особенность?
Цель кластеризации в Serpstat — собрать кластеры так, чтобы все ключевики были максимально близки по тематике и не упустить из виду ни один из ключевиков.
1
Serpstat не собирает группы, отталкиваясь от самых высокочастотных фраз.
2
Мы изучаем все фразы в целом, отталкиваясь от их пересечений в SERPe.
3
У нас иерархическая структура кластеризации: фразы объединяются в группы (так называемый кластер), кластеры объединяются в группы более высокого уровня (суперкластеры), а суперкластеры объединяются в группы еще более высокого уровня (протокластеры).
4
Serpstat проверяет силу связи между всеми кластеризуемыми фразами, в зависимости от тех настроек, которые вы сами зададите.
Сила связи — количество одинаковых страниц в топ-30 результатов поиска по анализируемой ключевой фразе. Максимально возможное количество одинаковых результатов по фразам составляет 30 страниц.

Какие настройки кластеризации предлагает Serpstat?

Мы предлагаем две основные настройки: сила связи и тип кластеризации.

1) Сила связи включает три варианта — Weak/Medium/Strong

Настройка Weak говорит о слабой силе связи между фразами, Strong — о сильной связи. Medium — среднее между ними.

Strong требует большего количества общих урлов для объединения в кластер, чем Weak. Weak сообщает системе, что для объединения в кластер фразы должны иметь меньшее количество общих URL в топ-30 результатов поиска по фразе, чем в Strong.

2) Тип кластеризации может быть Soft или Hard.

Soft сообщает инструменту кластеризации, что фразы могут быть добавлены в кластер, если хотя бы у одной пары из кластеризуемых фраз есть одинаковые URL в поиске, в зависимости от силы связи (Weak/Strong).
При выборе Hard-кластеризации, у всех фраз в одном кластере будут одинаковые URL-ы в топ-30 результатов поиска по фразе (в зависимости от выбора Weak/Strong).

Результатом кластеризации методом Hard является синонимичное и точное ядро, но большое количество кластеров, так как фразы входят в кластер только при ярко выраженной смысловой близости.
По завершении кластеризации часть фраз может оказаться в каталоге Unsorted (нераспределенные в группы). Это фразы, которые не попали ни в один кластер. Возможно, эти фразы имеют отдаленное отношение к тематике и их следует удалить из списка кластеризуемых фраз.

Альтернативное решение — создать обособленные страницы под эти фразы, либо переместить их в один из кластеров, если вы считаете, что фразы подходят создаваемому семантическому ядру.

Какой способ кластеризации выбрать?

Что выбрать Strong+Hard, Strong+Soft, Weak+Soft или Weak+Hard?

По умолчанию мы используем Soft+Medium. Но каждый для себя и в процессе работы с этим инструментом поймет, какие параметры подойдут к каждому конкретному случаю. Все зависит от однородности тематики и смысловой близости фраз, которые вы собрались кластеризовать.

Если фразы изначально близки по смыслу, например, тематика кроссовок различных брендов, то лучше выбрать параметры Strong+Hard или Strong+Soft, чтобы в кластер объединялись максимально близкие синонимы. Вы получите много кластеров, которые можно использовать под отдельные страницы или узкие категории.

В случае же разнообразных тематик и услуг, например, сбора семантического ядра для мультитоварного интернет-магазина или широкопрофильного медицинского центра, лучше выбрать кластеризацию Weak+Soft. Выбор Strong+Hard даст больше кластеров и возможность детальнее раздробить собранное ядро.
Больше о том, как устроена кластеризация в Serpstat и чем она отличается от кластеризации в других сервисах смотрите в нашем новом видео:

Сколько это стоит?

Стоимость использования «Кластеризации» включена в стоимость вашего тарифа.

  • В плане А нет возможности кластеризовать фразы.
  • План B включает 4000 ключевиков на кластеризацию.
  • План С — 12 000 фраз.
  • План D — 25 000 фраз.

Внимание! Пока инструмент находится в режиме Beta, стоит ограничение — в одном проекте нельзя группировать более 2 тыс. фраз.

Как работать с инструментом «Кластеризация»?

Читайте дальше, чтобы узнать, как настроить ключевые фразы для кластеризации и как трактовать полученные отчеты.

Настраиваем кластеризацию

1. Перейдите в раздел «Инструменты» и кликните кнопку «Открыть» в ячейке «Кластеризация и текстовая аналитика»
2. Нажмите кнопку «Создать проект»

3. Введите в полученной ячейке название проекта и домен (если собираетесь проводить текстовую аналитику по конкретному домену) нажмите «Далее»:

4. Задайте список фраз или загрузите их в окошко в файле CSV или TXT

5. Добавьте поисковую систему, страну, регион и город

6. Выберите силу связи, тип кластеризации и нажмите «Готово»

Выпейте чайку или просто отвлекитесь, фразы ушли на кластеризацию ;)
7. В результате получите примерно такую таблицу:
Где 3 — это кластер, состоящий исключительно из фраз, расположенных справа, 2 — суперкластер и 1 — протокластер.
Напомню:

Протокластер — набор суперкластеров. Как правило, в протокластер объединяются суперкластера, представляющие определенную категорию объектов.

Суперкластер — набор кластеров. Суперкластер объединяет близкие по смыслу фразы, но немного менее синонимичные, чем непосредственно фразы из кластера.
Итак, мы получили суперкластеры по аренде квартир, мониторам, макбукам, холодильникам, нижнему прессу, которые, в свою очередь, разделились на дополнительные группы — кластеры.

Разбираем кластер — полученный отчет

В окошке справа найдете список всех фраз, разделенных на группы и сводную информацию по кластеризации:
1. Каждая фраза наделена определенным значением — силой связи. Она показывает, насколько близка ключевая фраза из кластера к общей тематике кластера по шкале от 0 до 1.

2. Параметр «однородность» говорит о том, насколько связаны по тематике ключевые фразы в этом кластере (измеряется от 0 до 1).

3. По этим фразам ранжируется определенный URL. Если при создании проекта вы добавили сайт, то мы подберем из страниц этого сайта наиболее соответствующие тематике кластера. Если вы этого не сделали, то можете добавить страницу уже в этом отчете. Просто наведите на URL в отчете и появится кнопка «Редактировать».
Над каждым полученным кластером можно провести текстовую аналитику. Об этом инструменте читайте в соответствующей статье.

Обратите внимание на раскрывающееся меню в кластере:
1. Кнопка «Найти ключевые фразы» включит поиск по кластеру среди имеющихся фраз

2. С помощью кнопки «Удалить фразы» можно удалить некоторые фразы. Очевидно ;) Заранее нужны отметить их «галочкой»

3. Кнопка «Удалить подкластер» удаляет данную группу
4. При нажатии кнопки «Показать метатоп» появится список главных страниц-конкурентов в выдаче по фразам из кластера. Чем выше страница находится в метатопе, тем более релевантна она тематике данного кластера фраз.

В полученном дашборде также можно изменять название кластеров, создавать новые, открыть к просмотру все кластеры и скрыть некоторые. В общем, все для вашего удобства.

На этом всё! Попробуйте наш новый инструмент ;)
P.S. Наш математик-аналитик готовит еще более подробную статью о том, как работает кластеризация в Serpstat и в чем ее отличие от других сервисов на конкретных примерах.

Если уже сейчас у вас появилась масса вопросов, оставляйте всё-всё в комментариях, ответим в новое статье :)
Learn how to get the most out of Serpstat
Want to get a personal demo, trial period or bunch of successful use cases?
Send a request and our expert will contact you ;)
Found an error? Select it and press Ctrl + Enter to tell us

Recommended posts

Subscribe to our newsletter
Keep up to date with our latest news, events and blog posts!

Comments

Sign In Free Sign Up

You’ve reached your query limit.

Or email
Forgot password?
Or email
By clicking 'Sign Up Free' I agree to Serptat's
Terms of Service and Privacy Policy
Back To Login

Don’t worry! Just fill in your email and we’ll send over your password.

Are you sure?
Please pick the project to work on

Personal demonstration

Serpstat is all about saving time, and we want to save yours! One of our specialists will contact you and discuss options going forward.

These may include a personal demonstration, a trial period, comprehensive training articles & webinar recordings, and custom advice from a Serpstat specialist. It is our goal to make you feel comfortable while using Serpstat.

Name
Email
Phone
We are glad of your comment

Upgrade your plan

Sign Up Free

Спасибо, мы с вами свяжемся в ближайшее время

Invite
E-mail
Role
Message
Optional

You have run out of limits

You have reached the limit for the number of created projects. You cannot create new projects unless you increase the limits or delete existing projects.

I want more limits

Christmas is a time for miracles.

You are almost on the finish line of our Christmas quest. The last brick of your lego-promocode is left on the way up 55% discount.

Did not find previous lego-bricks? Fill the form anyway.

Name
Email
Phone