SEOにおけるトピックモデリング–上位にランク付けするための新しい方法

公開: 2022-04-24

SEOのトピックモデリングは、ドキュメントのコレクション内のトピックを発見するための統計モデルの使用です。 数千ページにわたる単語やフレーズの共起を調べることにより、アルゴリズムはトピックの関連性をページに割り当て、検索クエリに対してページをランク付けすることができます。

Topic Modeling In SEO – A Beginner’s Guide

目次
キーワードからトピックへ
トピックモデリングとトピック分類
2種類のトピックモデリング
潜在的ディリクレ配分(LDA)
潜在意味解析
トピッククラスター-上位にランク付けするための鍵
柱の投稿とトピッククラスター
トピッククラスターがSEOに役立つのはなぜですか?
トピックモデリングツール
MarketMuse
リサーチツール
競合ツール
最適化ツール
質問ツール
記事の洞察
結論
関連リソース

キーワードからトピックへ

検索エンジンの初期(1990年代後半)のアルゴリズムは、結果のキーワードをクエリのキーワードと照合するだけでした。 検索エンジンは、クエリのコンテキストやキーワードの背後にある意図を理解していませんでした。

しかし、それ以来、検索エンジンは長い道のりを歩んできました。 検索エンジンのアルゴリズムは、キーワードだけでなく、キーワードの背後にあるトピックも理解するようになりました。 キーワードではなくトピックに重点を置くことをセマンティックSEOと呼びます。

トピックを理解するための最初の大きな進歩は、2013年のGoogle Hummingbird Updateでもたらされました。そのとき、Googleは個々のキーワードだけでなく、フレーズ全体の分析を開始しました。

次の大きな前進は、2015年にGoogleのRankBrainアルゴリズムで実現しました。このアルゴリズムは、自然言語処理(NLP)を使用して、検索クエリの背後にあるコンテキストと意図を理解しました。

この時までに、関連性の尺度としてのキーワード密度はバックミラーで急速に消えていました。 それは話題の関連性に置き換えられていました。 現在Googleでどの程度ランク付けされているかは、コンテンツがトピックをどの程度包括的にカバーしているかによって異なります。

それ以来、グーグルや他の検索エンジンはトピックを理解する上でますます良くなっています。 彼らはトピックモデリングと呼ばれる技術を通してこれを行います。

トピックモデリングとトピック分類

トピックモデリングは、単語とフレーズの間に存在する関係を発見するための統計的手法です。

トピックモデリングでは、アルゴリズムは教師なしで情報自体のカテゴリを発見します。 これは、一連のドキュメントをスキャンし、他の単語やフレーズと一緒に出現する頻度に基づいて単語やフレーズをクラスタリングすることによって行われます。 トピックモデリングは「教師なし」学習手法です。アルゴリズムは、見つけたパターンに基づいて、カテゴリ自体を見つけます。

トピックモデリングは、人間が特定のルールを与えることによってアルゴリズムを「トレーニング」しなければならない機械学習技術であるトピック分類とは異なります。

トピック分類では、最初に使用する情報のカテゴリを定義する必要があります。 次に、これらの事前定義されたカテゴリでタグ付けされた生データの例をアルゴリズムに示します。 次に、アルゴリズムはそれらの事前定義されたカテゴリを使用してデータを分析します。

2つの手法の違いは次のとおりです。トピック分類では、人間がアルゴリズムにカテゴリを伝えますが、トピックモデリングでは、アルゴリズムは、単語やフレーズが特定のパターンでどのようにクラスター化するかを統計分析することで、カテゴリが何であるかを検出します。

これらのテキスト分析方法は、検索エンジンだけでなく、インターネット全体で使用されています。

たとえば、オンラインで顧客からのフィードバックを大量に受け取る企業は、トピックモデリングまたはトピック分類を使用して、購入後の通知、エクスペリエンスのフォローアップ、ブランドロイヤルティのフィードバック、顧客の苦情、顧客のレビューなどのカテゴリにフィードバックを分類できます。

2種類のトピックモデリング

これまで、私は「トピックモデリング」という用語を単一のものであるかのように使用してきました。 しかし、これは実際にはさまざまな手法を網羅する総称です。

ここで、さまざまなタイプのトピックモデリングのいくつかを見てみましょう。

潜在的ディリクレ配分(LDA)

潜在的ディリクレ割り当て(LDA)は、2つの仮定に基づいています。つまり、類似したトピックは類似した単語を使用し、ドキュメントは統計的分布を検出できるいくつかのトピックについて話します。

LDAは、トピックをn-gramなどの単語の配置に割り当てることにより、ドキュメントをトピックのリストにマップします。 n-gramは、自然言語処理で使用される一連の単語です。

指定子「n」は、n-gram内の単語数を示します。 N = 1の場合、n-gramには1つの単語が含まれ、N = 2の場合、n-gramには2つの単語が含まれます。

たとえば、「牛が月を飛び越える」という文には、次の2語のnグラム(バイグラムと呼ばれます)が含まれます。

  • 牛がジャンプします
  • 飛び越える
  • オーバー
  • ムーン

nグラムを取得したら、特定の単語が同じ文または同じ段落で、または互いに特定の距離で出現する可能性を予測する計算を行うことができます。

潜在的ディリクレ割り当ては、ドキュメントが特定の単語の配置で構成され、それらの配置がドキュメントのトピックを決定するという前提で機能します。

潜在意味解析

LDAと同様に、潜在意味解析は分布セマンティクスに基づいています。単語の意味は、単語が出現するコンテキストを調べることで把握できます。 英語の言語学者として、JRファースは次のように述べています。

単語の特定の配置にトピックを割り当てるLDAとは異なり、潜在意味解析は、一連のドキュメントで単語が出現する頻度を単純に計算します。 同様のトピックに属するドキュメントには、特定の単語の単語頻度のほぼ同じ分布が含まれていることを前提としています。

単語の頻度を計算するために使用する方法は、用語頻度-逆ドキュメント頻度またはtf-idfです。

用語頻度(TF)は、キーワードが1つのドキュメントに表示される回数を指します。

逆ドキュメント頻度(IDF)は、ドキュメントのコレクションに用語が出現する回数を測定します。

次に、用語頻度(TF)を逆文書頻度(IDF)で割って、TF-IDF値を取得します。

LDAとLSAはどちらも教師なし手法です。

トピッククラスター-上位にランク付けするための鍵

ご覧のとおり、検索エンジンはキーワードからトピックに注目を集めています。 彼らはさまざまな統計的手法を使用して、特定の単語が他の単語と一緒に見つかる方法でパターンを識別しています。 これらのパターンにより、検索エンジンはトピックを識別できます。

そのため、トピッククラスターは、検索結果で上位にランク付けされるための重要な部分になっています。

Googleは、信頼できる検索結果を提供したいと考えています。 つまり、トピックを深く、広くカバーするコンテンツを配信することを意味します。

柱の投稿とトピッククラスター

そのための最良の方法は、トピッククラスターモデルを使用することです。 これは、ピラーポストと呼ばれる中央ページを持つページのコレクションです。 柱の投稿はトピックを詳細にカバーしており、通常は少なくとも3000語の長さです。

柱の投稿では、トピックに関連するすべてのサブトピックをカバーします。 ただし、必ずしもこれらのサブトピックについて詳しく説明する必要はありません。 各サブトピックを紹介するいくつかの段落を使用してから、そのサブトピックをより詳細にカバーする別のブログ投稿にリンクしてください。

たとえば、柱の投稿は「庭の道具」に関するものである可能性があります。 これは、芝刈り機、ライントリマー、ヘッジトリマー、剪定ばさみ、マルチャー、リーフブロワー、エッジングツール、スプリンクラーなど、すべての主要なタイプのガーデンツールについて簡単に説明する平均的な記事よりも長くなります。

次に、これらのサブトピックごとに個別のコンテンツを作成し、柱の投稿からそれらの記事にリンクします。

トピッククラスターがSEOに役立つのはなぜですか?

トピッククラスターはどのようにランクを上げるのに役立ちますか? それはあなたのウェブサイトが特定のトピックのためのトピックの権限を持っていることを検索エンジンに示します。 トピッククラスターを作成すると、コンテンツは関連するキーワードでいっぱいになります。 そしてそれこそが、検索エンジンのアルゴリズムが現在求めているものです。 通常一緒に見つかるキーワードでいっぱいの密接に関連したコンテンツの10または15ページがあるウェブサイトは、アルゴリズムから青信号を取得します。

この記事のこれまでのところ、SEOの焦点としてトピックがキーワードに取って代わっている理由と、検索エンジンがトピックとそのサブトピックを理解するためにさまざまなトピックモデリングツールをどのように使用しているかを見てきました。

コンテンツ作成者として、特定のトピックを「マップアウト」してそのトピックを包括的にカバーするコンテンツを作成するのに役立つトピックモデリングツールがあるかどうか疑問に思うかもしれません。

まあ、当然のことながら、そのようなツールはすでに存在します。 次のセクションでは、そのうちの2つを紹介します。

トピックモデリングツール

このセクションでは、トピックの権限が高いコンテンツを作成するのに役立つ2つのトピックモデリングツールのウォークスルーを提供します。

MarketMuse

MarketMuseは、AIを活用したコンテンツ調査およびキーワードプランナーツールです。 機械学習と人工知能を使用して、コンテンツを分析し、カバーするトピックを提案し、より良いコンテンツを作成するのに役立つブリーフを作成します。

MarketMuseにログインすると、左側のメニューに、調査、競合、最適化、質問、接続の5つのツールが表示されます。

MarketMuse tools

これらのツールを1つずつ見ていきましょう。

リサーチツール

調査ツールにキーワードを入力すると、MarketMuseがそのキーワードの主なトピックを識別します。

MarketMuse research tool

トピックは左側の列に表示されます。 右側の列には、関連する各トピックの推定検索ボリュームと、そのトピックの検索トレンドを示すグラフが表示されます。

右端の列には、コンテンツでその関連トピックに言及する必要がある推奨回数が表示されます。 MarketMuseはこれにカラーコードを使用します:

  • 黄色=1〜2件の言及
  • 緑=3〜10件の言及
  • 青=10以上の言及

トピックをクリックすると、関連する各トピックにドリルダウンできます。 そのトピックのバリアントのリストが表示されます。

MarketMuse research tool

これらのバリエーションをコンテンツに含めると、複数のキーワードのランク付けに役立ちます。 また、検索エンジンは、トピックを詳細にカバーするコンテンツに特定の単語が一緒に表示されることを認識しているため、記事のトピックの権限も高まります。

競合ツール

Competeツールは、何千ものドキュメントを分析することによってトピックモデルを作成します。 次に、そのモデルに対して上位20の結果を分析し、その結果をヒートマップとして表示します。

Competeは、特定のトピックの競争を評価および分析し、そのトピックに必要なカバレッジについて決定を下すために使用されます。

Competeのヒートマップは、あなたが書きたい主題に競争がどのようにアプローチするか、どの関連トピックを含める必要があるか、そしてコンテンツを群衆から目立たせるためにどのトピックをカバーする必要があるかをすばやく理解するのに役立ちます。

marketMuse compete tool

[競合]画面の上部に、そのトピックの上位20件の検索結果が表示されます。 各検索結果の下には、その記事のMarketMuseコンテンツスコアがあります。 これは、MarketMuseによって開発された独自のスコアであり、ページがトピックをどの程度カバーしているかを示します。

ヒートマップのカラーコードは、各コンテンツがトピックをどの程度カバーしているかを示しています。

  • 赤=0言及
  • 黄色=1〜2の言及
  • 緑=3〜10件の言及
  • 青=10以上の言及

ページがトピックをどの程度カバーしているかを評価する簡単な方法は、列を垂直方向にスキャンすることです。

use MarketMuse to check the topical authority of competing content

同様に、行全体を水平方向にスキャンすることで、競合他社が特定のトピックをどのようにカバーしているかを確認できます。

MarketMuse compete tool

Competeツールで探すべきもう1つのことは、コンテンツのスコアです。 これらにより、トップランクのコンテンツがそのトピックをどの程度カバーしているかが一目でわかります。

using content scores in MarketMuse

スコアが低い場合は、十分に調査されたコンテンツでそのトピックの上位にランク付けされる可能性が高いことを示しています。

競合画面の左側に、トピックモデルを構成するすべてのトピックが表示されます。

Competeツールを使用する場合は、必須のトピックとトピックのギャップの2つを探す必要があります。

必須のトピックは、検索結果の上位ページで一貫して見つかるトピックです。 うまく機能するには、これらのトピックを作品に含める必要があります。

トピックのギャップは、競合他社がカバーしていないトピックです。 競合他社に欠けているトピックを含めることで、コンテンツを最適化する絶好の機会です。

最適化ツール

最適化ツールは、コンテンツがトピックをどの程度カバーしているかについてリアルタイムのフィードバックを提供するテキストエディタです。 キーワードを入力するだけで、記事のURLが表示されます。

MarketMuse optimize tool

右側のパネルのカラーコードは、その用語を使用した回数と、その用語を使用する必要がある回数を示しています。

コンテンツに提案された用語を追加すると、カラーコードが更新され、その用語の最適な言及数に近づいていることが示されます。

[フィード]タブでは、ページを下にスクロールするときに、コンテンツがトピックにどの程度対応しているかを継続的に評価できます。

using the MarketMuse optimize tool

[競合]画面の上部に、コンテンツスコア、平均スコア、目標スコア、単語数、平均単語数、および目標単語数を示すステータスバーが表示されます。

MarketMuse word count and status bar

質問ツール

MarketMuseの質問ツールは、記事を書く研究段階にあるときに役立ちます。 それはあなたのトピックに関連する最もよくある質問をあなたに示します:

MarketMuse questions tool

コンテンツに関連する質問を含めることは、記事の話題の権威を高めるもう1つの方法です。

画面の右側に、「実行」というボタンのある列が表示されます。 これにより、他の4つのツールのいずれかで各質問を実行するオプションが提供されます。

MarketMuse questions tool

MarketMuseは、トピックを分析し、作品のコンテンツが可能な限り多くのトピックをカバーしていることを確認するための強力なツールです。 MarketMuseを特に便利なものにしているのは、その特定のキーワードの上位の結果に基づいていることです。

検索結果の上位にランク付けされたページでカバーされているトピックが表示されるだけではありません。 また、トピックのギャップも表示されます。 トピックのギャップに対処することで、コンテンツを他のページから際立たせることができます。

記事の洞察

Article Insightsは、もう1つのトピックモデリングツールです。

特定のトピックの上位10件の検索結果に表示されるキーワードを特定するのに役立ちます。 コンテンツを競合他社のコンテンツと比較することで競合他社の分析に役立ち、競合他社が使用していないキーワードを確認できます。 また、キーワードを人、製品、会社、または場所のいずれかにタグ付けすることにより、エンティティの検出に役立ちます。

Article Insightsで最初に行う必要があるのは、プロジェクトを作成することです。 プロジェクトに名前を付けてから、ターゲットにするキーワードを追加します。

Article Insights topic modeling tool

次に、キーワードは処理キューに入ります。分析が完了するまでに数分かかる場合があります。

キーワードが処理されたら、[表示]ボタンをクリックする必要があります。

次に、左側に書き込みインターフェイス、右側に分析の2つの部分で構成される画面が表示されます。

Article Insights AI content tool

記事エディタには、「記事」と「簡単な説明」の2つのタブがあります。

Article and Brief buttons

Briefは、記事に関するメモを残すことができる場所です。 記事をライターと共有するためのリンクを取得できる共有ボタンがあります。

右側には、コンテンツのすべての分析を含むパネルがあります。

これらには以下が含まれます:

  • 言葉の数
  • 記事で使用したキーワード
  • 競合他社が使用したキーワード(ギャップ分析)
  • 使用した見出しと競合他社が使用した見出しの数。
  • コンテンツの独自性
  • 読みやすさスコア

記事を最初から書き始めることも、進行中の記事をURLからインポートすることもできます。

Article Insights import content

記事エディタにコンテンツをロードすると、ツールはそのキーワードの上位10件の検索結果に対してコンテンツを分析します。

Article Insights Score tab
  • パネル1と2は、記事の完成度と、目指すべき単語数を示しています。
  • パネル3は、コンテンツで使用されている上位15個のキーワードを示しています。
  • パネル4は、競合他社が使用したキーワードと、使用したキーワードの数を示しています。
  • パネル5は、使用した見出しを示し、競合他社が使用した見出しと比較します。

見出しパネルの下には、「一意性」スコアを表示するパネルと、フレッシュリーディングスコアを提供するツールがあります。

Article Insights unique content tool

「一意性」ツールには、「ArticleRe-writer」というボタンが含まれています。

それをクリックすると、記事エディタが開き、[調査]タブから追加したスニペットを書き直すために使用できる同義語の便利な提案が表示されます。 ハイライトされた単語の上にカーソルを置くと、ツールはその単語の代替同義語を提供します。

Article Insights re-writer tool

これは、コンテンツをすばやく書き直すのに役立つ非常に便利です。

右側のパネルの上部に沿って7つのタブがあります。 これまで、[スコア]タブで作業してきました。

[競合他社]タブをクリックすると、そのキーワードの上位10の競合他社のリストと、各競合他社のキーワードグループが表示されます。 これらのキーワードグループは、各競合他社が使用する上位のキーワードを示しています。

Article Insights competitors tab

競合他社を選択および選択解除できます。これは、コンテンツに関連しないと思われる結果がある場合に役立ちます。

次のタブは「リサーチ」です。 このタブは、上位のコンテンツからスニペットを取得します。

Article Insights research tab

リサーチスニペットをクリックすると、記事エディタに追加されます。 次に、それを自分のコンテンツの一部にするために書き直す必要があります。

次のタブは「見出し」です。 このタブには、選択した各競合他社に使用されている見出しが表示されます。 ページに表示されている見出しの数と、見出しのレベルを正確に確認できます。

Article Insights headings tab

次は「質問」タブです。

このタブは、メインキーワードに関連するGoogleからの質問を引き出します。 これらは、トピックの権限を取得するために記事に追加できるサブトピックです。

Article Insights questions tab

次のタブは「トピック」です。 このツールは、トピックにグループ化された関連キーワードを表示します。 それらのトピックに一致する段落は、そのトピックパネルに配置されます。

Article Insights topics tab

トピックの概要は、段落に簡単に追加できる関連キーワードを見つけるのに役立ちます。 これらの関連する単語を段落に追加すると、コンテンツのトピックの権限が高まり、記事の品質が大幅に向上します。

最後のタブは「複製」です。 このツールは、コンテンツ内で重複しているフラグメントを検出します。 このツールで赤でマークされているものはすべて書き直す必要があります。

便利な機能があるので、[スコア]タブのキーワードパネルに戻りましょう。 そのパネルでキーワードをクリックします。

Article Insights

そのキーワードは、[競合他社]タブで強調表示されます。 次に、競合他社がそのキーワードを使用した回数を確認できます。

Article Insights

同じキーワードが[調査]タブでも強調表示されます。

Article Insights research tab

これは、特定のキーワードに対してコンテンツを最適化しようとしているときに便利な機能です。

結論

アルゴリズムがキーワードの焦点から離れてトピックを理解しようとするにつれて、コンテンツがトピックを包括的にカバーすることがますます重要になっています。

それが検索結果のトップにランクインするための鍵になりつつあります。

この記事では、ドキュメント内およびドキュメントセット内での単語の共起をよりよく理解するために検索エンジンが現在使用しているさまざまなトピックモデリング手法について説明しました。

ドキュメント内の類似したキーワードの存在、頻度、および近接性が、トピックを理解するために検索エンジンによってどのように使用されているかを見てきました。

検索エンジンがこれらのツールを使用してトピックの権限を理解している場合、コンテンツ作成者は同じ手法を使用して、コンテンツがトピックを適切にカバーしていることを確認する必要があるのは当然です。

そこで、MarketMuseやArticle Insightsなどのツールが登場します。AIを使用して、あなたが書いているトピックを分析し、そのトピック内のサブトピックと、そのトピックのランク付けに使用する必要のあるキーワードを示します。

関連リソース

  • トピッククラスターとSEO–コンテンツハブを構築するための5つの簡単なヒント
  • セマンティックSEO-初心者向けガイド
  • 5つの簡単なステップでWebサイトにサイロ構造を作成する
  • 潜在的セマンティックインデックスとは:7つの重要な事実
  • LSIキーワードとは何ですか?それらを使用して上位にランク付けする方法