重複コンテンツと SEO: 完全ガイド
公開: 2022-09-11あなたのウェブサイトのコンテンツを別のウェブサイトに置くことを想像してみてください! あなたのウェブサイトの重複したコンテンツが誤ってそこに配置されたのか、誰かがあなたのサイトからコンテンツ ブロックを盗んだのかは問題ではありません。 状況を正すために迅速に行動する必要があります。
また、あなたが小さなビジネスを担当しているか、巨大な多国籍企業を担当しているかは問題ではありません。 重複したコンテンツは、SEO に適した Web サイトの取り組みにとって危険です。
重複コンテンツを見つけて、それがウェブサイトのパフォーマンスに内部的またはドメイン間で影響を与えているかどうかを判断する方法を見てみましょう.
重複コンテンツとは?

他の Web サイトまたは同じ Web サイトの複数のページにあるコンテンツの類似または正確なコピーであるコンテンツは、重複コンテンツと呼ばれます。 Web サイトに重複したコンテンツが多数あると、Google のランキングに悪影響を与える可能性があります。
別の言い方をすれば:
重複コンテンツとは、別のページのコンテンツとまったく同じコンテンツです。 ただし、「Duplicate Stuff」には、他のコンテンツと同様のコンテンツが含まれます…たとえ少し書き直されたとしても。
重複コンテンツとSEOの関係は?
Google は、コンテンツの複製に対して罰則を課しません。 ただし、主要な検索エンジンは同一のコンテンツをフィルタリングするため、訪問者が迂回され、ペナルティが発生する可能性があります. その結果、ウェブサイトのランキングが低下します。 重複したコンテンツは、検索エンジンがランキングのために同一のページから選択することを余儀なくされるため、Google の混乱の原因です。
元のコンテンツがSERPのランキングに選ばれない可能性があるため、誰が元のコンテンツを作成したかは問題ではない. 重複したコンテンツが避けるべき SEO の失敗の 1 つである多くの理由の 1 つは、このためです。
これを支援するSEOスペシャリストを雇うことを検討してください. コンテンツの重複はもはや問題ではなくなり、SEO サービスはかなり安価になります。
ページ上の重要な要素はどれですか?
コンテンツの重複の問題を回避するには、Web サイトのすべてのページに独自のメタ記述とページ タイトルが HTML コードに含まれていることを確認してください。 h1、h2、h3 などの見出しは、サイトの他のページのものとは異なる必要があります。
メタの説明、タイトル、および見出しは、Web サイトのコンテンツのごく一部を構成しますが、重複コンテンツの灰色の領域からできるだけ離れた場所に配置することをお勧めします。 これは、検索エンジンに Web サイトのメタ ディスクリプションの価値を見てもらうための優れた方法です。
重複コンテンツは SEO にどのように影響しますか?
Google は、重複するコンテンツを含むページをランク付けしたくありません。
実際には、Google によると:
「Google は、固有の情報を含むページをインデックスに登録して表示するためにあらゆる努力を払っています。」
その結果、サイトに明確な情報がないページがあると、検索エンジンの結果が損なわれます。 重複コンテンツが多いサイトが直面する最も一般的な 3 つの問題を次に示します。
オーガニック トラフィックの減少:
これはかなり自明です。 Google は、インデックス内の他のページからコピーされたコンテンツを使用するページがランク付けされることを望んでいません。 (これには、自分の Web サイトのページを含めることができます。)
あなたのサイトに 3 つのページがあり、それらすべてが同等のコンテンツを持っているとします。

Google は、2 つのページのどちらが「オリジナル」であるかは不明です。 その結果、3ページすべてがランキングに苦労することになります。

ペナルティ (非常にまれ):
Google によると、コンテンツが重複していると、ペナルティが課されるか、ウェブサイトのインデックスが完全に削除される可能性があります。

ただし、これは非常にまれです。 また、Web サイトが他の Web サイトから意図的にコンテンツをスクレイピングまたは複製している場合にのみ行われます。

そのため、通常、サイトに多数の重複ページがある場合、「重複コンテンツ ペナルティ」について心配する必要はありません。
インデックスされたページが少ない:
これは、多数のページを持つ Web サイト (e コマース サイトなど) では特に重要です。

重複したコンテンツが常に Google によってランク付けされるとは限りません。 インデックスはまったく作成されません。
サイトのページがインデックスに登録されていない場合、クロール バジェットが重複コンテンツに浪費されている可能性があります。
ベストプラクティス
異なる URL で同じコンテンツを監視する
これは、重複コンテンツの問題の最も一般的な原因です。
あなたが e コマース ストアのオーナーだとしましょう。
また、製品ページで T シャツを提供しています。

すべてが正しく配置されていれば、その T シャツはすべてのサイズと色で同じ URL から入手できます。


ただし、サイトが製品の新しいバージョンごとに新しい URL を生成することに気付く場合があります。これにより、コンテンツが重複する何千ものページが作成されます。
インデックスされたページを確認する
Google にインデックスされたサイトのページ数を調べることは、重複コンテンツを見つける最も簡単な方法の 1 つです。
これを行うには、Google にアクセスして、site:example.com と入力します。

または、Google Search Console にアクセスして、インデックスされたページを確認します。
サイトが正しくリダイレクトされることを確認する
常に同じページの多数のバージョンがあるとは限りません…同じサイトの異なるバージョンがある場合もあります。
珍しいことですが、私は野生で何度も目撃しました。
この問題は、Web サイトの「WWW」バージョンが「非 WWW」バージョンにリダイレクトされない場合に発生します。
これは、HTTPS に切り替えた後に HTTP サイトをリダイレクトしなかった場合にも発生する可能性があります。
つまり、サイトの複数のバージョンはすべて同じ場所に配置する必要があります。

301 リダイレクトを使用する
サイトの重複コンテンツの問題を解決する最も簡単な方法は、301 リダイレクトを使用することです。 サイトに重複したコンテンツ ページが多数ある場合は、それらを元のページにリダイレクトするだけです。 Googlebot がアクセスすると、リダイレクトを評価し、元のコンテンツのみをインデックスに登録します。
同様のコンテンツに注意してください
重複コンテンツは、別の情報源から一語一句複製されたコンテンツを常に意味するわけではありません。
実際、Google は重複コンテンツを次のように定義しています。コンテンツが技術的に実際のものと異なっていても、重複コンテンツの問題が発生する可能性があります。

ほとんどの場合、これは問題ではありません。 ほとんどの Web サイトには、数十ページのページがあります。 また、各ページに独自のコンテンツを書き込みます。 ただし、状況によっては、「類似した」重複コンテンツが表示されることがあります。
Web サイトの各ページに 100% 独自のコンテンツを作成するのは時間がかかりますか? うん。 ただし、サイトのすべてのページのランキングを真剣に考えている場合は必要です。
Canonical タグを使用する

検索エンジンは、rel=canonical タグの意味を理解しています。
「はい、当サイトにはコンテンツが重複しているページが多数あります。 ただし、これは元のページです。 残りは無視できます。」
Google によると、コンテンツが重複しているページをブロックするよりも、canonical タグを使用することをお勧めします。

(たとえば、web ページの HTML で robots.txt または noindex 要素を使用して Googlebot をブロックします)
そのため、サイトに多数の重複ページが見つかった場合は、次のいずれかを実行できます。
- 式からそれらを削除します。
- リダイレクトする必要があります。
- canonical タグを使用する必要があります。
ツールを使用する
重複コンテンツを検出する機能を備えた SEO ツールがいくつかあります。
サイトライナー 、たとえば、Web サイトで重複したコンテンツが多いページを検索します。

ページを統合する
前述したように、同じコンテンツのサイトが多数ある場合は、それらを 1 つのページにリダイレクトする必要があります。
しかし、類似したコンテンツを含むページがある場合はどうなるでしょうか? ただし、各ページに独自のコンテンツを作成することはできます。または、それらを 1 つのメガページに結合することもできます。
Noindex WordPress タグまたはカテゴリ ページ
WordPress を使用している場合、タグとカテゴリのページが自動的に生成されることに気付いたかもしれません。 これらのページには重複したコンテンツが豊富にあります。
ユーザーにとって便利なように、これらのページに「noindex」タグを追加することをお勧めします。 そうすれば、検索エンジンにインデックスされずに存在できます。 または、これらのページがまったく生成されないように WordPress を構成することもできます。
スクレイピングされたコンテンツとは?
スクレイピングされたコンテンツは、あるウェブサイトの所有者が有機的な可視性を向上させるために別のウェブサイトのコンテンツをスクレイピングするときに発生します。 これらのウェブマスターは、他のウェブサイトから取得したスクレイピングしたコンテンツをマシンに書き換えるよう説得しようとします。
泥棒は頻繁にコンテンツ内のブランド用語を更新しようとしないため、スクレイピングされたコンテンツは簡単に見つけられる場合があります。 Google の検索インデックスを操作しようとしていることが発覚した場合、あなたの Web サイトのランクは大幅に低下するか、検索結果から完全に削除される可能性があります。
最後の言葉
不注意による複製を避けることも重要です。これは、すべてのコンテンツに一度に影響を与える Google のペナルティにつながる可能性があるためです。
1) オリジナリティを確保するために、新しいものを何も追加せずにテキストや写真を単にコピーして貼り付けるのではなく、各単語が作成されていることを確認してください。
2) キーワードを適切に使用して、コンテンツの関連性を維持します。
3) 可能であれば、同義語を使用します。
Google のアルゴリズムは、スパム行為のある Web サイトを特定して罰するために継続的に更新されています。