Дмитрий Иванов: Как определить «коммерческость» запроса с помощью машинного обучения?

В какой-то момент я плюнул, и решил использовать машинное обучение во благо. Первое, с чего я начал — это прогнозирование трафика и классификация различных запросов, в том числе и по коммерческости. Это начало давать определенный профит. Я понял, что можно экономить время сотрудников, можно получать результаты, которой несопоставимы с человеческими.
То есть если посадить очень крутого SEO-специалиста, он быстро справится. Если посадить среднячка, он может косячить, отлынивать. Но если дать ему в руки инструмент, который позволит быстро анализировать, интерпретировать информацию, он начинает работать, как топовый специалист. Для меня очень важно научить это делать самостоятельно и передать своим сотрудникам, чтобы они могли это делать.
На конференции 8P ты рассказывал про классификацию на коммерческие и некоммерческие запросы. Расскажи, что еще можно делать с помощью машинного обучения или, может, оно ограничено этим кругом задач.
Я построил весь свой опыт в машинное обучение для того, чтобы выявлять из большого количества запросов, те, что будут хороши по многим якорям.
Якорями я называю определенные параметры — популярность запроса, его коммерческость, конкурентность, сложность вывода. Проводится интегральная средняя по каждому из этих якорей, которые в совокупности будут самыми лучшими. Как правило, это те запросы, на которые больше всего тратят денег и ближе всех находятся к топу по конкретному сайту. А вообще, аналитику нужно делать под конкретный проект.
Сейчас мы пока предоставляем услугу прогнозирования трафика и оценки приоритетов запросов. Эту услугу чаще всего покупают SEO-компании, для того, чтобы понять сколько трафика они могут привести клиентам.
1) По нашим меркам, запрос будет коммерческим тогда, когда он подразумевает покупку товара/услуги у человека, который его задает. Люди на основе своего опыта и логики пытаются догадаться о намерении человека по запросу.
Обычный человек охарактеризовал бы коммерческую фразу примерно так: «Наверное, это словосочетание со словом "купить"».
2) Для поисковика — это тот запрос, который приведет человека по его собственному желанию на страницу, имеющую коммерческое содержание. Это обычно либо посадочная страница, либо какая-то другая продажная. Поисковику важно, чтобы человек задавая вопрос, быстро нашел на него ответ. Если он хочет купить, поисковик должен выявить его намерение, этот интент на основе запросов миллионов людей, и дать то, что ему нужно.
3) Как же есть на самом деле? Запрос можно назвать коммерческим тогда, когда он с высокой вероятностью приведет человека к покупке товара или услуги. Двух мнений быть не может, одни запросы с большей вероятностью продадут, другие — с меньшей.
Поэтому поисковая система экспериментирует, разным людям показывает разную выдачу, разные документы. Они могут быть коммерческими, некоммерческими и смешанными. Вы должны понимать, что коммерческость — это небинарный показатель.
Выдача может быть смешанной и на 50% коммерческой. Она может быть размечена поисковиком сегодня в 9:00 утра так, а завтра в 9:00 вечера уже выглядит по-другому и уже не являться коммерческой. Касательно суток я утрирую, но в течение недели все еще может поменяться.
Как определить коммерческие ключевики самостоятельно, руками, без программистов или в Excel? Какие факторы ты бы порекомендовал использовать для определения именно коммерческих запросов?
Если серьезно, то в Экселе это сделать сложно. Excel не имеет какого-то текстового анализатора. Можно собрать такие данные: бюджет по Яндекс Директ, бюджет по Google Adwords, количество ссылок. Если на фразу кто-то тратит деньги, мы делаем предположение, что это запрос, скорее всего, коммерческий. На информационные фразы реже кто-то тратит деньги.
Второй из вариантов — использовать программный пакет для статистического анализа, который содержит большое количество модулей: текстовый анализатор, нейросети, методы машинного обучения и т.д. В него это все зашито. Прелесть пакета в том, что там есть кнопки, которые можно нажимать и программа все сделает за тебя без лишних настроек. В видео подробно описано, как работать с этим программным комплексом.
Для того, чтобы определить коммерческость, одной Ексельки недостаточно, но в совокупности с программным комплексом статистики, это сделать несложно.
Можем ли мы их назвать полукоммерческими? Или псевдокоммерческими? С точки зрения поисковика — нет. Он хорошо разделяет информацию и коммерцию, но с точки зрения здравого смысла — если мы попадаем на какую-то прослойку, которая все равно нас приводит к коммерции («как вылечить грибок» и т.д.), то мы задаемся вопросом «это полотно — информационное или это фундамент к коммерческому запросу?»
Отвечая на твой вопрос, могу сказать, что грани между информационными и коммерческими запросами размыты настолько сильно, что порой не мой способ, не способ с паттернами не дадут точного ответа, что это за запрос.
Оценивая запрос, можно сказать только то, что он либо скорее коммерческий (выше 4 баллов), либо скорее некоммерческий (меньше 4), либо неопределенный. Неопределенные запросы нужно изучать детальнее.
Serpstat — набор инструментов для поискового маркетинга!
Находите ключевые фразы и площадки для обратных ссылок, анализируйте SEO-стратегии конкурентов, ежедневно отслеживайте позиции в выдаче, исправляйте SEO-ошибки и управляйте SEO-командами.
Набор инструментов для экономии времени на выполнение SEO-задач.
Используйте лучшие SEO инструменты
Проверка обратных ссылок
Быстрая проверка обратных ссылок вашего сайта и конкурентов
API для SEO
Получите быстро большие объемы данных используя SЕО API
Анализ конкурентов
Сделайте полный анализ сайтов конкурентов для SEO и PPC
Мониторинг позиций
Отслеживайте изменение ранжирования запросов используя мониторинг позиций ключей
Кейсы, лайфхаки, исследования и полезные статьи
Не успеваешь следить за новостями? Не беда! Наш любимый редактор подберет материалы, которые точно помогут в работе. Только полезные статьи, реальные кейсы и новости Serpstat раз в неделю. Присоединяйся к уютному комьюнити :)
Нажимая кнопку, ты соглашаешься с нашей политикой конфиденциальности.