Web サイトの重複コンテンツの問題を解決する方法
公開: 2019-06-11重複コンテンツは、SEO の主要な懸念事項です。 危険なリンクがあり、Google のペナルティを回避しています。 コンテンツが重複していると、サイトのオーガニック トラフィックが損なわれる可能性があります。 SEOに携わる誰もがこれを理解しています。 これは、コンテンツの重複を簡単に回避できるという意味ではありません。 あなたの最善の努力にもかかわらず、あなたのサイトは依然として重複コンテンツの問題に悩まされているかもしれません.
このガイドは、これらの問題を解決するのに役立つように設計されています。 コンテンツの重複が発生する主な原因について説明します。 次に、重複コンテンツの問題を回避および解決するためにできることの詳細について説明します。 ただし、最初に、重複コンテンツとは何か、なぜそれが重要なのかを説明する価値があります。
相談を予約する
重複コンテンツと Google
重複コンテンツとは何かを説明する最善の方法は、Google 自身がそれをどのように定義しているかを見ることです。 重複コンテンツに関するサポート ガイドラインでは、次の定義を提供しています。
「他のコンテンツと完全に一致するか、かなり類似している、ドメイン内またはドメイン間のコンテンツの実質的なブロック。」
コンテンツの重複が重要な理由は単純です。 これは、Google がユーザーに提供しようとしているものに、それがどのように影響するかによるものです。 検索エンジンは、個別の情報を含むページをインデックスして表示しようとします。 これは、より良いユーザー エクスペリエンスを確保したいという彼らの継続的な願望の一部です。
コンテンツが重複しているページは、個別の情報を持っているとは見なされません。 そのため、Google はこれらの重複ページをフィルタリングします。 つまり、重複コンテンツを含むページの 1 つだけがリストされます。 これは、ドメインのオーガニック トラフィックに深刻な悪影響を与える可能性があります。 サイトへのトラフィックを増やすページは、まったくリストされません。
Google が重複コンテンツに罰則を課すというのはよくある誤解です。 そうではありませんが、重複したコンテンツの悪用が疑われる場合、彼らは行動します。 それは、ランキングを操作するためにコンテンツが使用される場合です。 その場合、彼らは:
関連するサイトのインデックス作成とランキングを適切に調整してください。 その結果、サイトのランキングが低下したり、サイトが Google インデックスから完全に削除されたりする可能性があります。 その場合、検索結果に表示されなくなります。
ここまでで、サイトでコンテンツの重複を避けたいことは明らかです。 気をつけていても発生することがあります。 これには多くの方法があります。
重複コンテンツが発生する仕組み
すでに述べたように、重複したコンテンツは意図的にドメインに掲載される可能性があります。 通常、Google のランキングを騙したり操作したりする手段として。 すべての SEO 専門家は、Google のアルゴリズムがいかに賢いかを知っています。 彼らの中で最も愚かで無関心な人だけが、そのような操作で逃げることができると考えるでしょう.
サイト上のコンテンツの重複は、自然に発生したものである場合がはるかに多い. これは、特定の技術的な問題または単純な人為的ミスのいずれかが原因です。 これが発生する主な方法を理解することが重要です。 独自の重複コンテンツの問題を特定するのに役立ちます。 また、可能な限り最適なソリューションを選択しやすくなります。
これから説明する重複コンテンツの原因は次のとおりです。
- フィルタリングと追跡のための URL パラメータ
- 商品カテゴリーページのクロスオーバー
- 商品説明の重複
- URL に関する技術的な問題
- 印刷用ページ
- コンテンツ作成の問題
フィルタリングと追跡のための URL パラメータ
URL パラメータは、ページの URL の末尾に追加されるサフィックスのようなものです。 それらは多くの状況で発生し、多くの場合、ページのコンテンツを大幅に、またはまったく変更しません。 問題は、検索エンジンにとって、末尾に別のパラメーターを持つ URL が別の URL として認識されることです。 「2 つの」URL によってリンクされているコンテンツが同じである場合、Google はそれを重複コンテンツとして識別します。
この代表的な例は、e コマース サイトでの製品のフィルタリングです。 これらのタイプのサイトのほとんどすべてで、顧客は製品をフィルタリングできます。 特定の価格帯の製品や特定の素材で作られた製品のみを表示したい場合があります。 製品をフィルタリングすると、URL パラメータが URL に追加されます。 ただし、表示されるコンテンツ (製品など) はすべて別の場所で複製されます。
別の例は、追跡の場合です。 追跡パラメーターを使用すると、サイト訪問者のソースを追跡できます。 これは、さまざまな SEO の取り組みの ROI を監視するために非常に重要です。 '/?source=rss' のようになります。 それらはページのコンテンツに影響を与えませんが、一意の URL のように検索エンジンにも目を向けます。
商品カテゴリーページのクロスオーバー
また、e コマース サイト特有の問題として、カテゴリ ページのクロスオーバーがあります。 多くのサイトには、主に同じ製品を表示するさまざまなカテゴリ ページがあります。 これは多くの場合、正当で理解可能な理由で行われます。
たとえば、ギフト サイトには、「彼へのギフト」や「父の日のギフト」という名前のカテゴリがあるとします。 2 つのカテゴリは、異なる顧客を引き付ける可能性があります。 ただし、カテゴリ ページに表示される製品はほぼ同じです。 それだけが Google にとって重要なことであり、そのうちの 1 つのページだけをインデックスに登録する可能性があります。
商品説明の複製
カテゴリ ページから 1 レベル下の e コマース サイトは製品ページです。 これらは、重複コンテンツの問題の一般的な原因にもなります。 このようなページへの訪問者は、短い製品説明があることを期待します。 それは、製品の機能と特性が顧客にどのように販売されるかです。
多くの商品を販売するサイトでは、商品ごとに固有の説明を作成しないことがよくあります。 多くの企業は、一般的な情報をコピーして貼り付けるだけです。 多くの場合、それは供給業者または製造業者によって提供されています。 これにより、さまざまなドメイン内およびドメイン間で重複するコンテンツが大量に発生します。
この場合の最大の問題は、サイトが Amazon のようなはるかに大きな小売業者と同じ商品を販売している場合です。 説明をコピーすると、商品ページが Amazon で見つかったコンテンツと重複する可能性があります。 Google は間違いなく、あなたのページではなく Amazon のページをインデックスに登録します。
URL に関する技術的な問題
URL パラメーターだけでなく、コンテンツの重複の問題につながる可能性がある URL の技術的な問題が他にもいくつかあります。 1 つ目は「セッション ID」の形式です。 これらは、サイト訪問者に「セッション」が与えられるときに URL で使用されます。 これは多くの場合、商品をショッピング カートに追加してそこにとどまらせるためです。
訪問者がサイトを移動すると、すべての内部リンクにセッション ID が追加されます。 これにより、検索エンジンが重複コンテンツと見なす可能性のある多数の URL が作成されます。 同様に、CMS の一部として乱雑な URL を使用すると、同様の効果が生じる可能性があります。 順序を変更するカテゴリと記事のパラメータを持つ URL が代表的な例です。
印刷用ページ
CMS は、印刷に適したページを作成する可能性があります。 これらのページは、記事ページなどからサイトにリンクされます。 明示的に停止しない限り、Google はこれらのページを見つけることができます (詳細は後述)。
Google は、重複するページの 1 つだけをフィルタリングしてインデックスに登録します。 それは、元のバージョンまたは印刷用のバージョンである可能性があります。 印刷に適したページではなく、元のページをランク付けしたい. 後者には、すべての広告、リンク、その他のコンテンツが含まれているわけではありません。

コンテンツ作成の問題
上記のほとんどは、重複コンテンツの問題の技術的な原因です。 ヒューマン エラーが発生するのは、コンテンツ作成の領域です。 最近のほとんどすべてのサイトには、ブログまたは同様の情報リソースがあります。 訪問者に有益な情報を提供するのに役立ちます。 ブログには多くの重複コンテンツが存在する場合があります。
これは、コンテンツの作成を信頼してはいけない人に任せていることが原因である可能性があります。 コンテンツの重複が引き起こす可能性のある問題を理解していない人。 彼らは、作成している SEO の問題を知らずに、コンテンツをコピーまたは再作成する可能性があります。 彼らのエラーは、いつも同じタイトルタグを使用するのと同じくらい小さいかもしれません. それらは、他のサイトからコンテンツを直接コピーするのと同じくらい大きくなる可能性があります.
重複コンテンツに関する問題の解決
これで、コンテンツの重複に関する問題がどこから発生したかがわかったはずです。 上記はすべて、多くのサイトに共通する問題の原因です。 それらを理解し、サイトに影響を与えたものを知ることは非常に重要です. 原因が異なれば、解決策も異なるからです。
重複コンテンツの問題を解決するための最良の方法をいくつか紹介します。 すでに言及した問題と原因のどれが、各ソリューションに最も適しているかを示します。 当社のソリューションは、次の 2 つのカテゴリに分類されます。
- 教育および予防ソリューション
- 実用的な解決策と回復の取り組み
教育および予防ソリューション
理想的な世界では、コンテンツの重複による問題が発生する前に回避したいと考えています。 これまでに説明した問題の原因を知ることは、出発点として最適です。 その知識があれば、新しいコンテンツが同じ問題に巻き込まれないようにするための措置を講じるのに役立ちます。
たとえば、システム設定でセッション ID を無効にすることができます。 これにより、重複 URL の問題が発生する可能性がなくなります。 Web サイトに印刷用のページを含めることをまったくやめることもできます。 とにかく、今日多くの人がページを印刷する理由があるわけではありません。 ハッシュタグ ベースのトラッキング キャンペーンも、パラメータ ベースのトラッキングに代わる優れた方法です。
コンテンツの重複の原因について学んだので、他の人を教育することができます。 Web 開発者や製品チームを含めることができます。 製品カテゴリのクロスオーバーに関連する問題を彼らに説明できます。 そうすれば、彼らはそれに応じて製品を配置することを知ることができます. フリーランスまたは社内のコンテンツ作成者は、物事をユニークに保つ方法について説明を受けることもできます.
それが理想の世界です。 実際には、重複コンテンツの問題をすべて解決できない場合があります。 そのような状況では、いくつかの実用的なソリューションが必要です。 それらは、あなたがすでに苦しんでいる問題から回復するのに役立つものになるでしょう.
実用的な解決策と回復の取り組み
これまでのガイドでは、重複コンテンツの問題がどこから発生した可能性があるかを示しているはずです。 また、さらなる問題の発生を回避するためのヒントもいくつか提供しました。 残っているのは、サイトで既に重複コンテンツの問題が発生している場合の対処法をいくつか提案することです。 さまざまなオプションが用意されています。
正規 URL
問題が同じコンテンツにつながる異なる URL にある場合、正規 URL が役立ちます。 前述のパラメータまたはカテゴリ ページのフィルタリングの場合と同様です。 正規 URL は「正しい」URL です。 同じコンテンツにつながるページのうち、Google にインデックスしてもらいたいページの URL です。 その都度、どのページかを決める必要があります。
特定したら、どのページが正規 URL であるかを Google に伝えるのは簡単です。 他のページの <head> セクションに HTML 要素を追加するだけです。 「canonical link 要素」と呼ばれ、次のようになります。 「rel=canonical」。 URL が続くと、Google が選択したページを指します。
301リダイレクト
Google を正規の URL に向けることは、「ソフト リダイレクト」を使用していると説明されることがあります。 これは本格的な 301 リダイレクトとは対照的です。 重複コンテンツを削除できない、または削除したくない場合にも、これらを使用できます。
URL に 301 リダイレクトを適用すると、選択したページに Google が誘導されます。 検索エンジンがインデックスするのはそのページになります。 これは、製品カテゴリ ページが重複する問題に対する有効な解決策になる可能性があります。
Web トラフィックの観点から最も価値のあるカテゴリを特定するだけで済みます。 次に、301 リダイレクトを使用して、他の重複または重複ページからそのカテゴリに移動できます。
Noindex タグ
Noindex タグは、ページの HTML ソース コードに追加できるディレクティブです。 ページをインデックスに登録したくないことを Google に明示的に伝えます。 これにより、Google がインデックスに登録したいページを除外して、不要なページを優先するのを防ぐことができます。
Noindex タグは、印刷に適したページが原因で発生する問題の最適なソリューションです。 これらの各ページに Noindex タグを適用する必要があります。 これにより、各ページの元のバージョンが Google のインデックスに登録されるようになります。
コンテンツの書き換え
重複コンテンツの問題は、簡単に解決できない場合があります。 これは、ブログの投稿や製品の説明に問題がある場合に当てはまります。 彼らが重複したコンテンツを作成した場合は、問題のあるコピーを見つけて書き直す必要があります。 このソリューションは、時間と労力がかかります。 問題に適切に対処する方法は他にありません。
時間と労力を少し節約できる 1 つの方法は、Copyscape のような無料のオンライン ツールを使用することです。 Copyscape は、盗用されていないコンテンツを作成できるように設計されています。 サイトに URL を入力すると、Web で重複するコンテンツが検索されます。 これにより、切り取ったり、置き換えたり、書き直したりする必要があるコンテンツの正確な要素を見つけることができます。

ニック・ブラウンは、SaaS SEO エージェンシーであるアクセラレータ エージェンシーの創設者兼 CEO です。 Nick はいくつかの成功したオンライン ビジネスを立ち上げ、Forbes に寄稿し、本を出版し、英国の代理店から、現在は米国、APAC、EMEA で事業を展開し、160 人の従業員を抱える企業へと急速に成長しました。 彼はかつてマウンテンゴリラに突撃されたこともある