Serpstat использует файлы cookie для обеспечения работоспособности сервиса, улучшения навигации, предоставления возможности связаться с командой поддержки, а также маркетинговых активностей Serpstat.

Нажав кнопку "Принять и продолжить", вы соглашаетесь с Политики конфиденциальности

Принять и продолжить

Закрыть

Сообщить об ошибке

Отменить
23571 22 7
SEO Читать 12 минут 3 августа 2017

Все, что вы хотели знать об инструменте Serpstat «Текстовая аналитика»

Текстовая аналитика сайта в Serpstat
Фото Инны Arsa, главного редактора в Serpstat
Инна Arsa
Главный редактор в Serpstat
Надеюсь, у вас было достаточно времени, чтобы прочитать наш предыдущий пост об инструменте кластеризации ключевых слов. Данная статья будет посвящена второй части этого инструмента — текстовой аналитике.

Читайте внимательно, чтобы ничего не упустить.
Или можете все узнать из этого видео:

Что такое текстовая аналитика и зачем она нужна?

Текстовая аналитика — это инструмент, который поможет оптимизировать текст на страницах вашего сайта. Ни для кого не секрет, что одним из важнейших показателей ранжирования является текст. Именно на оптимизацию этого фактора направлен наш инструмент.

Предположим, что ваша целевая страница не находится в топе по необходимым ключевикам. В таком случае имеет смысл изменить содержание страницы, чтобы повысить ее релевантность заданным поисковым запросам. Цель нашей текстовой аналитики — создать рекомендательную базу по оптимизации контента на вашей странице.

Ее можете использовать для решения основных задач:

1) генераций заданий для копирайтеров на основе анализа текстов конкурентов, находящихся в топ-15;
2) анализа текстового фактора ранжирования вашей страницы и расширения семантического ядра;
3) анализа важных слов в тематике и получения списка LSI-слов (слов, определяющих тематику).

Как вы уже наверняка догадались, инструменты «Кластеризация» и «Текстовая аналитика» связаны между собой. Кластеризация нужна для того чтобы выбрать ключи, которые можно разместить на одной странице. Текстовая аналитика — чтобы их проанализировать. Кластеризация помогает не только разбить фразы на группы, но и автоматически назначить страницу (url) вашего домена к кластеру, чтобы потом провести по ней текстовую аналитику.

Это мощная связка, позволяющая автоматизировать весь процесс работы с ключевиками.

В чем основная трудность любой текстовой аналитики?

Очевидный факт для всех, кто занимается SEO — если страница попала в топ по запросу, то, значит, ее содержимое воспринимается поисковым алгоритмом, как релевантное запросу, и поисковик поставил ее на высокую позицию.

И как следствие мы получим то, что страницы попавшие в топ по запросу содержат в себе те признаки, которые «привели» их в этот топ.

То есть достаточно исследовать конкурентов и сравнить их с целевой страницей, чтобы получить все необходимые рекомендации по семантике? Но не все так просто.

Проблема в том, что мало кто знает, на основе каких URL-ов нужно давать рекомендацию. Ведь наша целевая страница может быть информационной, а в выдаче будут попадаться коммерческие запросы. Или же наоборот. В выдаче могут быть видео, нужно ли учитывать их? А может наш целевой урл это видео, и нам нужна рекомендация на основе текстов и описаний именно других роликов. А что, если мы не очень хорошо разбираемся в предметной области, и неверно указали некоторые ключевики, тем самым внося шум.

Мы постарались решить эти проблемы.

Каковы преимущества нашего алгоритма?

1
Мы тщательно отбираем тематику страниц, на основе которых строится рекомендательная база текстовой аналитики. Другие же сервисы собирают слова из всех тематических групп сразу, не фильтруя их при этом.

Так например, для продвижения страницы по доставке продуктов на дом Serpstat предложит только слова, которые логически связаны с доставкой еды. Другие сервисы могут предложить вам внести в текст ключевые фразы из другой ниши. В продукты они могут порекомендовать добавить и антивирус Касперского и разные SaaS-ы, которые будут в поисковой выдаче под словом "продукт".
2
Качественно подбираем слова для рекомендательной базы, используя собственный алгоритм, который вытаскивает только значимые слова для тематики. У нас вы не найдете в рекомендациях добавить предлоги, союзы и прочий нерелевантный мусор, как это делают другие инструменты.
3
Мы не советуем конкретное количество употребления слов и их словоформ, мы анализируем лексему целиком. Контролируем переспам текста и советуем сократить частоту одного и того же слова в тексте.
4
Мы не советуем конкретную длину текста, мы рекомендуем приемлемый диапазон длин. Анализируем текст полностью и находим отсутствующие слова в тексте, которые есть у конкурентов в топе и которые влияют на ранжирование.
5
Мы показываем релевантность поисковых запросов к вашему тексту не в сухих числах, а используем визуализацию, которая показывает в каком диапазоне релевантности конкурентов находится ваш текст.
Дальше — подробности.

Как работает текстовая аналитика в Serpstat?

Упрощенно текстовая аналитика в Serpstat работает следующим образом:

1. Разделяет топы URL-ов в выдаче по заданным поисковым запросам на группы, например: видеозаписи, информационные статьи, каталоги, коммерческие страницы и т.д и определяет к какой группе из них наиболее близок целевой URL.

Фильтрация происходит даже для учета страниц, содержащих видео. Если среди указанных поисковых запросов попадаются фразы, не совсем релевантные тематике, они никак не повлияют на результаты текстовой аналитики. Чтобы избежать рекомендаций, основанных на нерелевантных предметах, Serpstat делит страницы ваших конкурентов на семантические группы. Такой алгоритм предоставляет более точную рекомендательную базу.
ТА проводится на основе страницы сайта (если указан URL), списка ключевых фраз из кластера, для которых оптимизируется эта страница, и топ-15 страниц, показывающихся в результатах поисковой системы (далее ПС) по анализируемым фразам.
Возьмем, например, ключевое слово «продукт». Вот так выглядит поисковая выдача Google по этому запросу:
По одному общему запросу поисковые системы показывают, как информационную, так и коммерческую выдачу
Как видите, Google предлагает как страницы о пищевых продуктах, так и о SaaS-продуктах. Мы делим эти результаты на две группы и даем рекомендации на основе тех URL, которые вы добавили. Соответственно, если ваша страница посвящена только SaaS-продуктам, мы исключим из отчета нерелевантные результаты по страницам из пищевых продуктов.

Если вы не добавите при настройках целевую страницу, то рекомендации будут строиться на результатах анализа самой крупной группы конкурентов по фразе.То же самое работает с коммерческими и информационными запросами. Если вы введете macbook в Google, то получите:
Пример смешанной выдачи по запросу MacBook
Результаты содержат как информационные страницы, так и коммерческие.

Если вас интересует покупка макбуков, Serpstat проанализирует содержимое вашей страницы, отбросит нерелевантных информационных конкурентов и даст рекомендации на основе анализа коммерческих.

2. На основе анализа других страниц в этой группе дает рекомендации по улучшению текстовой составляющей нашей страницы и увеличения релевантности страницы по отношению к фразам.

На этом этапе мы настраиваем список ключевых слов для каждой области страницы: Title, H1 и Body. Список ключевых слов формируется с помощью трехуровневой метрики «TF-IDF-CDF» (term frequency, inverse document frequency, cluster's document frequency). Ее мы применяем для ранжирования слов, определяющих тематику для целого кластера.

Она:

  • учитывает количество вхождений ключа в текст (TF);
  • контролирует малоинформативные слова — слова встречающиеся в большом проценте текстов, стоп-слова (IDF);
  • находит самые значимые для каждого кластера слова — LSI-слова(СDF).
Иллюстрация к текстовой аналитике книги Мастер и Маргарита
Следующий пример показывает применение алгоритма к тексту "Мастера и Маргариты".

Теги всего текста:

маргарита — 0.011
воланд — 0.008
коровьев — 0.008
прокуратор — 0.008
азазелло — 0.005
пилат — 0.005
кот — 0.004
варенуха — 0.004
берлиоз — 0.004
иешуа — 0.004
мастер — 0.003

Как видите, результат показал нам действительно ключевые фразы текста. Наименее частотных в перечне нет. Кроме того, слова, которые чаще всего используются в лексиконе языка, но действительно имеющие мало значения для книги, в списке не присутствуют.

Как настроить текстовую аналитику?

Если вы уже забыли, то напомню, текстовая аналитика проводится:

  • на основе целевой страницы (если при настройке указан URL);
  • списка ключевых фраз из кластера, для которых оптимизируется наша страница.

В случае если указана целевая страница, анализируется весь текстовый контент вашей страницы и даются рекомендации по использованию различных фраз, исходя из контента конкурентов по фразе из топ-15.

Если не указана целевая страница, то наши рекомендации будут строиться исходя из анализа самой крупной группы конкурентов по фразе. При этом некоторые отчеты, например, оптимизированность страницы для ключевой фразы в сравнении с конкурентами, будут отсутствовать.

Поэтому для того, чтобы провести текстовую аналитику, сначала нужно сгруппировать фразы с помощью кластеризации. Как настроить фразы для кластеризации читайте в этом фрагменте нашей предыдущей статьи.


Итак, у вас завершенный проект кластеризации ключевых фраз. Что делать дальше?

Перейдите в проект кластеризации ключевых слов и выберите кластер, для которого хотите выполнить анализ текста. Затем нажмите «ТА» (Начать текстовую аналитику) → «Начать анализ» в верхнем правом углу.
Настройка текстовой аналитики в Serpstat
Если вы укажете свой домен при запуске кластеризации ключевых слов, мы выберем наиболее подходящий URL-адрес и подключим его к кластеру. Если вы упустите этот шаг, ни в одном из кластеров не будет рекомендованных URL-ов. Если хотите, можете добавить или изменить URL-адрес для конкретного кластера перед началом анализа текста. Если у вас нет сайта, и ваша цель — настроить контент для предстоящего домена, оставьте, как есть.

Если хотите провести текстовую аналитику для всех кластеров нажмите на кнопку справа «Текстовая аналитика» и всплывет окошко:
Сортировка кластеров для текстовой аналитики по запросу микроволновая печь
Нажмите «Выбрать все» или выделите конкретные кластеры, для которых хотите провести кластеризацию.

По завершении анализа нажмите «Просмотреть результаты».
Просмотр результатов по текстовой аналитике

Что вы получаете в отчете по Текстовой аналитике?

Если вы следовали всем моим инструкциям, вскоре увидите страницу со следующими отчетами:
1
Список ключевых слов из этого кластера с показателями «Коэффициент штиля» и «релевантность».
Коэффициент штиля — показатель семантической близости фразы к тематике кластера по шкале от нуля до 100 процентов.

Релевантность — показатель соответствия страницы к ключевой фразе по сравнению с конкурентами. Наведите курсор на цветную полоску и увидите минимальный, средний и максимальный показатели релевантности среди группы страниц-конкурентов по данной фразе, а также релевантность вашей страницы.
Релевантность ключевиков в тексте и коэффициент штиля в тексте
2
Затем идет список рекомендуемых ключевых слов для всех областей вашего текста: Title и H1. Рядом с каждым ключевым словом вы увидите его показатели — значимость, популярность и покрытие.
Рекомендуемые слова — список слов, которые желательно включить в соответствующий элемент страницы, если в колонке «Покрытие» указано отсутствие cлова в Title вашей страницы. Мы приводим лемматизированные слова, но вы можете использовать рекомендованные слова в любой подходящей форме.

Значимость — это значимость слова для Title в рамках анализируемой группы страниц. Рассчитывается как соотношение данного слова к набору ("мешку", стат.) слов, используемых в title конкурентов.

Популярность — процент страниц-конкурентов из группы анализируемых URL, в Title которых встречается данное слово.

Покрытие — колонка может иметь три значения:

  • Включено — слово присутствует в Title целевой страницы.
  • Не включено — слово отсутствует в Title ключевой страницы.
  • Переспам — слово слишком часто употребляется в Title по сравнению с конкурентами; рассмотрите возможность уменьшения количества вхождений данного слово в Title целевой страницы.
Если целевой URL не указан, мы покажем употребление слова в лемматизированной форме в процентах по отношению к общему количеству уникальных слов, полученных из Title группы страниц-конкурентов по фразам из кластера. Такая функция будет полезна при написании статьи или подготовке технического задания для копирайтера.
Ключевые слова, которые должны входить в Title и H1
3
Последний фрагмент отчета посвящен Body целевой страницы, он разделен на две части.

Первая из них похожа на отчет Title / H1:
Список ключевых слов для Body текста, отсортированные по популярности и покрытию
Во второй части вы найдете анализ объема текста — алгоритм приводит минимальное, максимальное и оптимальное количество слов в Body на основе анализа соответствующих областей страниц конкурентов. А также дает рекомендации по увеличению или уменьшению объема текста.
Рекомендации по количеству слов в Body текста со списком возможных слов, минимальным и максимальным числом
Вот и все! Попробуйте наши новые инструменты прямо сейчас;)Если у вас есть вопросы, не стесняйтесь задавать их в комментариях!

Оцените статью по 5-бальной шкале

4.33 из 5 на основе 14 оценок
Нашли ошибку? Выделите её и нажмите Ctrl + Enter, чтобы сообщить нам.

Поделитесь статьей с вашими друзьями

Войти Регистрация

Вы исчерпали лимит запросов.

Или email
Забыли пароль?
Или email
Back To Login

Не волнуйтесь! Напишите свой электронный адрес и мы пришлем вам новый пароль.

Вы уверены?

Awesome!

To complete your registration you need to enter your phone number

Назад

Мы отправили код подтверждения на ваш номер телефона

Your phone Resend code Осталось запросов

Что-то пошло не так.

Свяжитесь с нашей службой поддержки
Или подтвердите регистрацию с помощью Телеграм бота Перейдите по этой ссылке
Выберите один из проектов

Знакомство с сервисом

Ознакомьтесь с основными возможностями Serpstat удобным способом!

Отправьте заявку для ознакомления с сервисом и мы свяжемся с вами в кратчайшие сроки. Наш специалист предложит подходящий вариант, который может включать персональную демонстрацию, пробный период, материалы для обучения и повышения экспертизы, личную консультацию, а также комфортные условия для начала работы с Serpstat.

Имя

Email

Телефон

Будем рады вашему комментарию
Увеличить лимиты

Улучшить тариф

Экспорт недоступен для вашего тарифного плана. Вам необходимо улучшить свой тариф до Lite или выше, чтобы получить доступ к инструменту Подробнее

Зарегистрироваться

Спасибо, мы с вами свяжемся в ближайшее время

Пригласить
Просмотр Редактирование

E-mail
Сообщение
необязательно
E-mail
Сообщение
необязательно

У вас закончились лимиты

Вы достигли лимита на количество созданных проектов и больше не можете создавать новые проекты. Увеличьте лимиты или удалите существующие проекты.

Я хочу больше лимитов