インターネット上に重複コンテンツが存在すると、サイトの評価や検索結果の順位といった検索エンジン最適化(SEO)の取り組みに悪影響を及ぼす可能性があります。
検索パフォーマンスを最大化させるためにも、重複コンテンツと判断される基準と具体的な悪影響や対策方法を確認しておきましょう。
本記事では、重複コンテンツの基本的な概念と、SEOにおける重複コンテンツのリスクについて詳しく解説していきます。重複コンテンツを回避する方法も紹介しますので、ぜひ参考にしてください。
「そもそもSEOについてあまり理解できていない」という方は、以下の記事も併せてお読みください。
【2023年最新・完全版】SEO対策とは?初心者向けに「どこよりも」わかりやすく解説!
重複コンテンツに対策する施策は、SEOの中で「内部SEO」に該当します。以下の記事で網羅的に内部SEOについて解説しているため、こちらも興味があればぜひお読みください。
重複コンテンツとは
重複コンテンツとは、異なる複数のWebサイトに掲載されている同一または類似内容のコンテンツのことです。同じ文章や情報が複数のURLに載っている状態は、SEO対策に悪い影響を与える可能性があります。
重複コンテンツの判断基準
コンテンツの内容が同一または類似しているとみなされると重複コンテンツと判断される可能性があります。そのため、できるだけ重複する文章やパラグラフ、文言の使用は避けたほうが良いでしょう。
本文だけでなく、記事のタイトルタグやメタディスクリプションなど主要なメタデータが類似している場合も重複コンテンツと判断されることがあります。
重複コンテンツは、自サイト内(同一ドメイン内)だけではなく、外部サイト(外部ドメイン)との間でも発生するので注意が必要です。
重複する内容が20〜30%程度であれば特に問題はありませんが、重複率が50%を超えると重複コンテンツと判断される恐れがあります。他記事と類似する内容のみの記事コンテンツは独自性がないと判断されて評価が下がるケースも多いため、重複は可能な限り避けるようにしたいところです。
重複コンテンツになってしまう主な原因
重複コンテンツになる主な原因のひとつは「内容や情報の類似」です。気をつけていても文言が似てしまうケースはあります。特に記事を執筆する際には表現の類似に注意しましょう。
悪意のある第三者が他サイトのコンテンツを盗んで自身のサイトに転載する「コンテンツスクレイピング」も、重複コンテンツの原因です。基本的には違法行為となりますが、著作権を無視した転載・転用は後を絶ちません。
また、まったく同じコンテンツが異なるドメインに掲載されると重複コンテンツが発生します。同じWebサイトを異なるドメインで運営する場合や、複数のサブドメインで同じコンテンツを公開する場合は注意が必要です。
重複コンテンツがSEOに与える影響
重複コンテンツは、SEOに以下のような影響を与えます。
- 検索結果に表示されにくくなる
- サイトの評価が分散する
- ペナルティの対象になる
検索結果に表示されにくくなる
検索エンジンは内容が重複したページを同時にランキングすることを避けるため、他のページに比べて検索結果に表示されにくくなる傾向にあります。場合によっては全く表示されなくなくなるので注意が必要です。
また、重複コンテンツの存在により、Webサイトへのクローラーの回遊率が低下したり、サイト内のページが正当な評価を受けれない可能性があります。そのため、高品質で重要なページがランキングされず、不適切なページがランキングされるなどのリスクが高まります。
ページの評価が分散する
重複コンテンツは、ページの評価を分散させる恐れがあります。ひとつのページに内容がまとまっていれば評価は分散しませんが、似たようなページが複数あると、ページの数だけ評価が分散する可能性があります。
また、被リンクの評価分散にも注意したいところです。重複コンテンツが別URLに存在するとサイト内部および外部から貼られるリンクが各ページに分散する可能性が高まります。評価は自動的にまとめられるケースもありますが、適切な評価を受ける機会を逃すことに変わりはありません。
ペナルティの対象になる
GoogleはWebページを適切に評価するためのアルゴリズムを採用しているため、重複コンテンツが検出されると以下のようなペナルティが課せられる恐れがあります。
- 検索結果の順位が下がる
- 検索結果に表示されない
- インデックスから削除される など
このようなペナルティが課せられると、アクセス数が激減してしまいます。意図的な重複や他サイトの盗用は絶対に避けましょう。
無意識な重複や一時的な重複コンテンツを対象としたペナルティは稀です。Googleは「ユーザーファースト」を掲げているため、ユーザーにとって有益で過度の重複でなければペナルティの対象にはなりません。
重複コンテンツの調べ方
重複コンテンツの調べ方は次の2つです。
- 自動フィルタリングを無効にして検索する
- 重複コンテンツチェックツールを活用する
自動フィルタリングを無効にして検索する
Googleは自動フィルタリングで重複コンテンツを除外しているため、この自動フィルタリングを無効にすることで除外コンテンツを確認する方法です。自動フィルタリングを無効にした際に表示されるページは、重複コンテンツとみなされている可能性があります。
自動フィルタリングを無効にする方法は次の3つです。
1.検索結果最終ページから再検索する
検索結果最終ページの「ここから再検索してください」をクリックすると、除外されたコンテンツが表示されます。
2.URLにパラメーターを追加する
検索結果URLの末尾に「&filter=0」を追加する方法です。このパラメーターを追加すると、「ここから再検索してください」をクリックしたときと同様の表示結果になります。
例:「https://www.google.com/search?q=検索ワード&filter=0」
3.検索演算子を使う
検索する際、サイトまたはドメインの前に検索演算子「site:○○」を使うと、そのサイト内に限定して検索結果を表示できます。自動フィルタリングが無効化されるため、特定のサイト内で重複コンテンツを探したい際に便利です。「site:」+「URL」+「スペース」+「キーワード」で検索すると、そのサイト内で特定のキーワードを含むページが検索結果に表示されます。
例:「site:https://example.com チェックツール」
※この例では、「https://example.com」のサイト内で「チェックツール」というキーワードを含むページが検索結果に表示されます。
重複コンテンツチェックツールを活用する
ツールを使えば重複コンテンツを簡単に確認できます。
Google Search Console
Google Search Consoleを使えば、インデックスから除外された重複コンテンツを確認できます。インデックス登録されていないコンテンツは自動フィルタリングを無効にしても表示されません。
Google Search Consoleで重複コンテンツを確認する手順は以下のとおりです。
1.管理画面の「ページ」をクリックして「ページがインデックスに登録されなかった理由」を確認する
2.重複がある場合は記載されている
記載箇所をクリックすれば該当URLも確認できます。
sujiko.jp
sujiko.jpは対象ページとの類似度を簡単にチェックできるツールです。比較したいサイトのURLを入力して「判定」をクリックするだけで簡単に結果がわかります。
重複コンテンツの対処方法
重複コンテンツが見つかった場合の対処方法は、主に以下の3つです。
- canonicalタグで正規化する
- 301リダイレクトを設定する
- Googleにインデックスの削除を要請する
canonicalタグで正規化する
canonicalタグは、複数の類似したコンテンツが存在する場合に、その中で最も重要なページやオリジナルなURLを指定するために使います。canonicalタグで正規化する際には、もっともオリジナルで重要なURLを選択しましょう。特に、外部のサイトに自社コンテンツの転載を許可する場合などは、canonicalタグで自社コンテンツのURLを指定することでペナルティを回避できます。
canonicalタグを設定すれば、検索エンジンは指定された正規のページを優先的に扱い、重複した他のページを無視します。検索結果にも正規のページが優先的に表示されるため、ランキングへの悪影響を避けることも可能です。
ただし、canonicalタグは100%の効果を保証するものではありません。検索エンジンがタグを適切に解釈して重複コンテンツを処理するかどうかはさまざまな状況によって異なります。重複コンテンツの問題に対処する効果的な手段であることに変わりはありませんが、他の方法と併用して重複コンテンツを避けるようにしましょう。
canonicalタグの設定は、重複しているすべてのページのHTML、headタグ内に以下のように記載をします。
<link rel=”canonical” href=”評価をまとめたいページのURLを指定”>
301リダイレクトを設定する
301リダイレクトは、旧バージョンや重複したコンテンツから特定のページへ転送する方法です。
301リダイレクトを設定すると、検索エンジンは旧ページの存在を無視して新しい正規のページを優先的に扱う傾向があります。そのため、重複コンテンツの問題を回避し、正規のページが検索結果で表示される可能性が高くなります。評価も引き継がれるので、ドメインの変更などをした際には必ず設定しましょう。
なお、301リダイレクトはすべての重複コンテンツに設定する必要があります。設定忘れがないように確認しておきましょう。
Googleにインデックスの削除を要請する
重複コンテンツが発覚した際は、不要な記事に対するインデックス削除をGoogleに要請します。削除要請の方法は主に以下の3つです。
サイトマップの再送信
サイトマップを再送信すれば、コンテンツの削除や追加を簡単に行えます。ただし、検索エンジンの次回クロールまでは反映されないため、重複コンテンツが消えるまでには多少の時間がかかります。
noindexタグの設置
noindexタグは、特定のページを検索エンジンのインデックスから除外するタグです。重複コンテンツにnoindexタグを使用すれば、インデックスから除外されます。noindexタグも検索エンジンのクローラーがクロールするまでは効果が現れません。
noindexタグは、インデックス削除をしたいページのHTML、headタグ内に以下のように記載をします。
<meta name=”robots” content=”noindex”>
GoogleSearch Consoleに削除リクエストをする
Google Search Consoleから削除申請可能です。手順は下記となります。
1.Google Search Consoleにアクセスして「削除」から「新しいリクエスト」を選択する
2.「URLを一時的に削除する」で削除したいURLを入力する
ただし、この方法で削除できるのは「一時的」です。早ければ数ヵ月程度で再掲されてしまいます。完全に削除したい場合は、記事やページの物理的な削除やnoindexタグを活用しましょう。
重複コンテンツがSEOに与える悪影響を排除して検索結果を向上させよう
重複コンテンツは検索結果に悪い影響を与える可能性があるので、canonicalタグや301リダイレクトを活用して検索エンジン向けの適切な対策を行いましょう。
テクニカルな対策だけではなく、重複する内容がないコンテンツを作成することも重要です。独自性の高いページが多ければWebサイト全体の評価を上げることもできます。
Webマーケティングを行う上で、コンテンツの活用は避けて通れません。成果につながるコンテンツを効率良く作りたいとお考えの方は、ぜひ弊社シンプリックの無料相談をご活用ください。お客様の現在抱えている課題や今後取り組もうとしていることなどをヒアリングしたうえで、弊社クライアントおよび弊社自身の成功事例をもとに、お客様が今取り組むべきことをお伝えし、弊社がどのような支援をできるかご説明させていただきます。