Тематическое моделирование в SEO — новый способ повысить рейтинг

Опубликовано: 2022-04-24

Тематическое моделирование в SEO — это использование статистических моделей для обнаружения тем в наборе документов. Изучая совпадение слов и фраз на тысячах страниц, алгоритмы могут назначать тематически релевантные страницы и ранжировать страницу по поисковому запросу.

Topic Modeling In SEO – A Beginner’s Guide

оглавление
От ключевых слов к темам
Тематическое моделирование против тематической классификации
Два типа тематического моделирования
Скрытое распределение Дирихле (LDA)
Скрытый семантический анализ
Тематические кластеры — ключ к более высокому рейтингу
Столпные посты и тематические кластеры
Почему тематические кластеры помогают в SEO?
Инструменты тематического моделирования
MarketMuse
Инструмент исследования
Инструмент «Конкурировать»
Инструмент Оптимизация
Инструмент «Вопросы»
Статья
Вывод
Связанные ресурсы

От ключевых слов к темам

На заре поисковых систем — в конце 1990-х годов — алгоритмы лишь сопоставляли ключевые слова в результатах с ключевыми словами в запросе. Поисковые системы не понимали контекст запроса или намерение ключевого слова.

Но поисковые системы прошли долгий путь с тех пор. Алгоритмы поисковых систем теперь понимают не только ключевые слова, но и тему, стоящую за ключевыми словами. Этот акцент на темах, а не на ключевых словах называется семантическим SEO.

Первый большой прогресс в понимании тем произошел с обновлением Google Hummingbird в 2013 году. Именно тогда Google начал анализировать целые фразы, а не только отдельные ключевые слова.

Следующий большой шаг вперед был сделан в 2015 году с алгоритмом Google RankBrain, который использовал обработку естественного языка (NLP) для понимания контекста и намерений поисковых запросов.

К этому времени плотность ключевых слов как мера релевантности быстро исчезала из зеркала заднего вида. На смену ему пришла актуальность. Ваш рейтинг в Google теперь зависит от того, насколько полно ваш контент охватывает тему.

С тех пор Google и другие поисковые системы все лучше и лучше разбираются в темах. Они делают это с помощью техники, называемой моделированием темы.

Тематическое моделирование против тематической классификации

Тематическое моделирование — это статистический метод обнаружения отношений, существующих между словами и фразами.

При тематическом моделировании алгоритм сам обнаруживает категории информации без присмотра. Для этого он сканирует набор документов и группирует слова и фразы в зависимости от того, как часто они встречаются рядом с другими словами и фразами. Тематическое моделирование — это «неконтролируемый» метод обучения: алгоритм сам обнаруживает категории на основе найденных шаблонов.

Тематическое моделирование отличается от тематической классификации, которая представляет собой метод машинного обучения, когда люди должны «обучать» алгоритм, задавая ему определенные правила.

При классификации тем сначала необходимо определить категории информации, которую вы хотите использовать. Затем вы даете алгоритму несколько примеров необработанных данных, которые были помечены этими предопределенными категориями. Затем алгоритм использует эти заранее определенные категории для анализа данных.

Разница между этими двумя методами заключается в следующем: при тематической классификации люди сообщают алгоритму, что представляют собой категории, тогда как при тематическом моделировании алгоритм определяет категории посредством статистического анализа того, как слова и фразы объединяются в определенные шаблоны.

Эти методы анализа текста используются не только поисковыми системами, но и в Интернете.

Например, компания, которая получает большое количество отзывов клиентов в Интернете, может использовать моделирование тем или классификацию тем для сортировки отзывов по категориям, таким как уведомления после покупки, последующие действия, отзывы о лояльности к бренду, жалобы клиентов и отзывы клиентов.

Два типа тематического моделирования

До сих пор я использовал термин «тематическое моделирование», как будто это что-то одно. Но на самом деле это общий термин, который охватывает целый ряд различных техник.

Давайте теперь посмотрим на некоторые из различных типов тематического моделирования.

Скрытое распределение Дирихле (LDA)

Скрытое распределение Дирихле (LDA) основано на двух предположениях: в сходных темах используются похожие слова и что в документах говорится о нескольких темах, для которых можно обнаружить статистическое распределение.

LDA отображает документы в список тем, назначая темы расположениям слов, таких как n-граммы. N-грамма — это последовательность слов, которые используются при обработке естественного языка.

Обозначение «n» относится к количеству слов в n-грамме. Где N=1, n-грамма содержит одно слово, где N=2, n-грамма содержит два слова и так далее.

Например, предложение «Корова прыгает через луну» будет содержать следующие n-граммы из двух слов (известные как биграммы):

  • корова
  • корова прыгает
  • перепрыгивает
  • над
  • Луна

Когда у вас есть n-граммы, вы можете производить вычисления, которые предсказывают вероятность того, что определенные слова будут встречаться в том же предложении или в том же абзаце, или на определенном расстоянии друг от друга.

Скрытое распределение Дирихле работает на основе предположения, что документы состоят из определенного расположения слов и что это расположение определяет тему документа.

Скрытый семантический анализ

Как и LDA, латентный семантический анализ основан на гипотезе распределения: значение слов можно понять, глядя на контексты, в которых слова появляются. Как выразился английский лингвист Дж. Р. Ферт: «Вы узнаете слово по компании, с которой оно связано» (Firth, JR 1957:11).

В отличие от LDA, который назначает темы определенному расположению слов, латентный семантический анализ просто вычисляет, как часто слова встречаются в наборе документов. Предполагается, что документы, относящиеся к сходным темам, будут содержать примерно одинаковое распределение частоты слов для определенных слов.

Метод, который он использует для вычисления частоты слов, — это Term Frequency-Inverse Document Frequency или tf-idf.

Термин Частота (TF) относится к тому, сколько раз ключевое слово появляется в одном документе.

Обратная частота документов (IDF) измеряет, сколько раз термин появляется в наборе документов.

Частота термина (TF) затем делится на обратную частоту документа (IDF), чтобы получить значение TF-IDF.

И LDA, и LSA являются неконтролируемыми методами.

Тематические кластеры — ключ к более высокому рейтингу

Как видите, поисковые системы переключают свое внимание с ключевых слов на темы. Они используют различные статистические методы для выявления закономерностей в том, как одни слова встречаются с другими словами. Эти шаблоны позволяют поисковым системам идентифицировать темы.

И именно поэтому тематические кластеры теперь являются жизненно важной частью высокого рейтинга в результатах поиска.

Google хочет предоставлять результаты поиска, которые являются авторитетными. Это означает предоставление контента, который хорошо охватывает тему как в глубине, так и в широте.

Столпные посты и тематические кластеры

Лучший способ сделать это — использовать модель тематического кластера. Это набор страниц с центральной страницей, называемой постом столба. Пост столба подробно освещает тему и обычно содержит не менее 3000 слов.

В основном посте вы освещаете все подтемы, связанные с вашей темой. Но вам не обязательно вдаваться в эти подтемы в мельчайших подробностях. Потратьте несколько абзацев на введение каждой подтемы, а затем дайте ссылку на отдельный пост в блоге, где вы более подробно освещаете эту подтему.

Например, ваш столбчатый пост может быть о «садовых инструментах». Это будет более длинная, чем обычно, статья, в которой вы кратко описываете все основные типы садовых инструментов: газонокосилки, линейные триммеры, кусторезы, секаторы, мульчеры, воздуходувки, обрезные инструменты, разбрызгиватели и т. д.

Затем вы должны создать отдельный фрагмент контента для каждой из этих подтем и сослаться на эти статьи из основной публикации.

Почему тематические кластеры помогают в SEO?

Как тематический кластер помогает вам занять более высокое место? Он показывает поисковым системам, что ваш сайт имеет актуальное значение для определенной темы. Когда вы создаете тематический кластер, ваш контент будет полон связанных ключевых слов. И это именно то, что сейчас ищут алгоритмы поисковых систем. Веб-сайт с десятью или пятнадцатью страницами тесно связанного контента, наполненного ключевыми словами, которые обычно встречаются вместе, получит зеленый свет от алгоритма.

До сих пор в этой статье мы рассматривали, почему темы заменяют ключевые слова в качестве фокуса SEO и как поисковые системы используют различные инструменты моделирования тем для понимания тем и их подтем.

Как создатель контента, вам может быть интересно, существуют ли инструменты моделирования темы, которые помогут вам «наметить» конкретную тему, чтобы вы могли создавать контент, который всесторонне охватывает эту тему.

Что ж, неудивительно, что такие инструменты уже существуют. И в следующем разделе я покажу вам два из них.

Инструменты тематического моделирования

В этом разделе вы познакомитесь с двумя инструментами моделирования тем, которые помогут вам писать контент с высоким тематическим авторитетом.

MarketMuse

MarketMuse — это инструмент для исследования контента и планирования ключевых слов на основе искусственного интеллекта. Он использует машинное обучение и искусственный интеллект для анализа контента, предложения тем для обсуждения и разработки сводок, которые помогут вам создавать более качественный контент.

Когда вы войдете в MarketMuse, вы увидите пять инструментов в левом меню: «Исследовать», «Соревнуйтесь», «Оптимизировать», «Вопросы» и «Подключение».

MarketMuse tools

Давайте рассмотрим эти инструменты один за другим.

Инструмент исследования

В инструменте исследования введите ключевое слово, и MarketMuse определит основные темы для этого ключевого слова:

MarketMuse research tool

Темы отображаются в левой колонке. В правом столбце вы увидите приблизительный объем поиска по каждой связанной теме, а также график, показывающий тенденцию поиска по этой теме.

Крайний правый столбец показывает рекомендуемое количество раз, когда вы должны упомянуть эту связанную тему в своем контенте. MarketMuse использует для этого цветовой код:

  • Желтый = от 1 до 2 упоминаний
  • Зеленый = от 3 до 10 упоминаний
  • Синий = 10+ упоминаний

Вы можете перейти к каждой связанной теме, щелкнув тему. Вы увидите список вариантов для этой темы:

MarketMuse research tool

Включение этих вариантов в ваш контент поможет вам ранжироваться по нескольким ключевым словам. Это также повысит тематический авторитет вашей статьи, потому что поисковые системы теперь знают, что определенные слова появляются вместе в содержании, которое глубоко охватывает тему.

Инструмент «Конкурировать»

Инструмент Compete создает тематическую модель, анализируя тысячи документов. Затем он анализирует 20 лучших результатов по этой модели и представляет результаты в виде тепловой карты.

Compete используется для оценки и анализа конкуренции по заданной теме и принятия решений о том, какое освещение вы хотите иметь для этой темы.

Тепловая карта Compete поможет вам быстро понять, как конкуренты подходят к теме, о которой вы хотите написать, какие связанные темы вам нужно включить и какие из них вы должны осветить, чтобы ваш контент выделялся из толпы:

marketMuse compete tool

В верхней части экрана Compete вы увидите 20 лучших результатов поиска по этой теме. Под каждым результатом поиска указана оценка контента MarketMuse для этой статьи. Это собственная оценка, разработанная MarketMuse, которая показывает, насколько хорошо страница охватывает тему.

Цветовые коды на тепловой карте показывают, насколько хорошо каждый фрагмент контента соответствует теме:

  • Красный = 0 упоминаний
  • Желтый = 1-2 упоминания
  • Зеленый = 3-10 упоминаний
  • Синий = 10+ упоминаний

Быстрый способ оценить, насколько хорошо страница охватывает тему, — просмотреть колонку вертикально вниз:

use MarketMuse to check the topical authority of competing content

Точно так же вы можете увидеть, как конкурс охватывает конкретную тему, просканировав строку по горизонтали:

MarketMuse compete tool

Еще одна вещь, которую нужно искать в инструменте Compete, — это оценки контента. Это позволяет вам сразу увидеть, насколько хорошо контент с высоким рейтингом охватывает эту тему:

using content scores in MarketMuse

Если баллы низкие, это указывает на то, что у вас есть хорошие шансы получить высокий рейтинг по этой теме с хорошо проработанным контентом.

В левой части экрана Compete вы увидите все темы, составляющие модель темы.

При использовании инструмента Compete нужно обращать внимание на две вещи: обязательные темы и пробелы в темах.

Обязательные темы — это те, которые постоянно находятся среди первых страниц в результатах поиска. Для хорошего выступления эти темы должны быть включены в ваше произведение.

Пробелы в темах — это темы, которые не охвачены конкурсом. Это отличная возможность оптимизировать ваш контент, включив в него темы, которых не хватает вашим конкурентам.

Инструмент Оптимизация

Инструмент «Оптимизация» — это текстовый редактор, который в режиме реального времени дает вам обратную связь о том, насколько хорошо ваш контент соответствует теме. Просто введите ключевое слово и URL вашей статьи, и MarketMuse покажет

MarketMuse optimize tool

Цветовые коды на правой панели показывают, сколько раз вы использовали этот термин и сколько раз вы должны использовать этот термин.

Когда вы добавляете предложенные термины в свой контент, цветовые коды будут обновляться, чтобы показать, что вы приближаетесь к оптимальному количеству упоминаний для этого термина.

Вкладка «Лента» дает вам текущую оценку того, насколько хорошо ваш контент соответствует темам, когда вы прокручиваете страницу вниз:

using the MarketMuse optimize tool

В верхней части экрана «Соревнование» вы увидите строку состояния, в которой отображается ваша оценка контента, средняя оценка, целевая оценка, количество слов, среднее количество слов и целевое количество слов:

MarketMuse word count and status bar

Инструмент «Вопросы»

Инструмент «Вопросы» в MarketMuse полезен, когда вы находитесь на стадии исследования при написании статьи. Он показывает вам наиболее часто задаваемые вопросы, связанные с вашей темой:

MarketMuse questions tool

Включение связанных вопросов в ваш контент — еще один способ повысить тематический авторитет вашей статьи.

В правой части экрана вы увидите столбец с кнопкой «Запустить». Это дает вам возможность запускать каждый вопрос в одном из четырех других инструментов:

MarketMuse questions tool

MarketMuse — это мощный инструмент для анализа темы и обеспечения максимально возможного охвата вашей статьи. Что делает MarketMuse особенно полезным, так это то, что он основан на первых результатах поиска по этому конкретному ключевому слову.

Он не только показывает, какие темы освещаются на страницах, которые занимают первые места в результатах поиска. Он также показывает пробелы в теме. Устранив пробелы в теме, вы можете выделить свой контент среди других страниц.

Статья

Article Insights — еще один инструмент моделирования тем.

Это поможет вам определить ключевые слова, которые появляются в первых 10 результатах поиска по определенной теме. Это помогает в анализе конкурентов, сравнивая ваш контент с контентом ваших конкурентов, чтобы вы могли видеть, какие ключевые слова они используют, а вы нет. И это помогает в обнаружении объекта, помечая ключевые слова как человека, продукт, компанию или место.

Первое, что вам нужно сделать в статье Insights, — это создать проект. Дайте вашему проекту имя, а затем добавьте ключевое слово, на которое вы хотите настроить таргетинг:

Article Insights topic modeling tool

Затем ключевое слово помещается в очередь на обработку — для завершения анализа может потребоваться несколько минут.

После обработки ключевого слова необходимо нажать кнопку «Просмотр».

Затем вы увидите экран, состоящий из двух частей: интерфейс записи слева и аналитика справа:

Article Insights AI content tool

В редакторе статей у вас есть две вкладки: «Статья» и «Брифт»:

Article and Brief buttons

Бриф — это место, где вы можете оставлять заметки о статье. Есть кнопка «Поделиться», где вы можете получить ссылку, чтобы поделиться статьей со своими авторами.

Справа находится панель со всей аналитикой по вашему контенту:

Это включает:

  • число слов
  • ключевые слова, которые вы использовали в своей статье
  • ключевые слова, которые использовали ваши конкуренты (анализ пробелов)
  • заголовки, которые вы использовали, и количество заголовков, которые использовали ваши конкуренты.
  • уникальность вашего контента
  • показатель удобочитаемости

Вы можете начать писать свою статью с нуля или импортировать незавершенную статью с URL-адреса:

Article Insights import content

Как только вы загрузите контент в редактор статей, инструмент проанализирует ваш контент по 10 лучшим результатам поиска по этому ключевому слову:

Article Insights Score tab
  • Панели 1 и 2 показывают, насколько завершена ваша статья и сколько слов вы должны стремиться.
  • Панель 3 показывает вам 15 самых популярных ключевых слов, используемых в вашем контенте.
  • Панель 4 показывает вам, какие ключевые слова использовали ваши конкуренты и сколько из них использовали вы.
  • Панель 5 показывает вам заголовки, которые вы использовали, и сравнивает их с заголовками, используемыми вашими конкурентами.

Под панелью «Заголовки» находится панель, которая показывает оценку «Уникальность» и инструмент, который дает вам оценку чтения Флеша:

Article Insights unique content tool

Инструмент «уникальность» содержит кнопку «Редактирование статьи».

Нажмите на нее, и откроется редактор статей с полезными предложениями по синонимам, которые вы можете использовать, чтобы переписать фрагменты, которые вы добавили на вкладке «Исследования». Наведите курсор на любое выделенное слово, и инструмент предложит вам альтернативные синонимы для этого слова:

Article Insights re-writer tool

Это очень полезно, так как помогает быстро переписать контент.

В верхней части правой панели расположены семь вкладок. До сих пор мы работали на вкладке Score.

Если вы нажмете на вкладку «Конкуренты», вы увидите список 10 лучших конкурентов по этому ключевому слову вместе с группой ключевых слов для каждого конкурента. Эти группы ключевых слов показывают вам самые популярные ключевые слова, используемые каждым конкурентом:

Article Insights competitors tab

Вы можете выбирать и отменять выбор конкурентов, что полезно, если есть результаты, которые, по вашему мнению, не имеют отношения к вашему контенту.

Следующая вкладка — «Исследования». Эта вкладка извлекает фрагменты из высокопоставленного контента:

Article Insights research tab

Нажмите на фрагмент исследования, и он будет добавлен в редактор статей. Затем вам нужно переписать его, чтобы сделать его частью вашего собственного контента.

Следующая вкладка — «Заголовки». На этой вкладке отображаются заголовки, используемые для каждого выбранного вами конкурента. Вы можете точно увидеть, сколько заголовков у них на странице и на каком уровне находится заголовок.

Article Insights headings tab

Далее идет вкладка «Вопросы».

На этой вкладке извлекаются вопросы из Google, связанные с вашим основным ключевым словом. Вот подтемы, которые вы можете добавить в свою статью, чтобы получить тематический авторитет:

Article Insights questions tab

Следующая вкладка — «Темы». Этот инструмент показывает вам связанные ключевые слова, сгруппированные по темам. Абзацы, соответствующие этим темам, помещаются в эту панель тем для вас:

Article Insights topics tab

Схема темы поможет вам обнаружить связанные ключевые слова, которые вы можете легко добавить в свои абзацы. Добавление этих связанных слов в ваш абзац повысит актуальность вашего контента и значительно улучшит качество вашей статьи.

Последняя вкладка — «Дубликаты». Этот инструмент обнаруживает фрагменты вашего контента, которые являются дубликатами. Вам нужно переписать все, что отмечено красным с помощью этого инструмента.

Вернемся теперь к панели ключевых слов на вкладке «Оценка», потому что она имеет полезную функцию. Нажмите на ключевое слово на этой панели:

Article Insights

Затем это ключевое слово будет выделено на вкладке «Конкурент». Затем вы можете увидеть, сколько раз ваши конкуренты использовали это ключевое слово:

Article Insights

Это же ключевое слово будет выделено на вкладке «Исследования»:

Article Insights research tab

Это полезная функция, когда вы пытаетесь оптимизировать свой контент для определенного ключевого слова.

Вывод

По мере того, как алгоритмы перестают фокусироваться на ключевых словах и пытаются понять темы, становится все более важным, чтобы ваш контент всесторонне охватывал тему.

Это становится ключом к ранжированию в верхней части результатов поиска.

В этой статье мы рассмотрели различные методы тематического моделирования, которые сейчас используют поисковые системы, чтобы лучше понять совместное появление слов в документе и в наборе документов.

Мы видели, как наличие, частота и близость похожих ключевых слов в документе используются поисковыми системами для понимания тем.

Само собой разумеется, что если поисковые системы используют эти инструменты для понимания авторитетности темы, создатели контента должны использовать те же методы, чтобы их контент правильно освещал тему.

И вот тут-то и приходят на помощь такие инструменты, как MarketMuse и Article Insights. Они используют ИИ для анализа темы, о которой вы пишете, и показывают вам, какие подтемы есть в этой теме и какие ключевые слова вы должны использовать для хорошего ранжирования по этой теме.

Связанные ресурсы

  • Тематические кластеры и SEO — 5 простых советов по созданию центров контента
  • Семантическое SEO — руководство для начинающих
  • Создайте силосную структуру на своем веб-сайте за 5 простых шагов
  • Что такое скрытое семантическое индексирование: 7 важных фактов
  • Что такое ключевые слова LSI и как их использовать для повышения рейтинга