2019.10.21SEO記事一覧

SEOにおける重複コンテンツによるペナルティの危険性と対策方法

  • このエントリーをはてなブックマークに追加

「重複コンテンツ」とは、コンテンツ内容が他のページの内容と重複しているものを指します。

Googleが低品質なコンテンツとみなすものの一つに、この「重複コンテンツ」があります。重複コンテンツに該当すると、ページが表示されなくなる可能性がある他、Googleのペナルティ対象となり、SEO的に大ダメージを受けるリスクがあります。

この記事では、どのようなコンテンツが重複コンテンツに該当するのか、重複コンテンツを避けるためにはどのような対応をとれば良いのかなどを解説します。これまで対策ができていなかった担当者の方も、この機会にWebサイトの内容をチェックしてみてください。

重複コンテンツとは?

まずは、「重複コンテンツとはなにか」という基本的な内容について解説します。

「重複コンテンツ」とは、タイトルやテキスト等のコンテンツ内容が他のページの内容と重複しているものを指します。Googleの公式サイトでは、以下のように定義されています。

『一般に、重複するコンテンツとは、ドメイン内または複数ドメインにまたがって存在する、他のコンテンツと完全に同じであるか非常によく似たコンテンツのブロックを指します。』

引用元:Google公式サイト

重複コンテンツには、大きく分けて「ドメイン内」か「ドメイン外」かという違いがあるので、それぞれについてもう少し詳しく見てみましょう。

同じドメイン内に重複している内容(コンテンツ)のページがある

同じドメイン内 = 同一Webサイト内に同じようなコンテンツが存在している状況です。自分でも気づかないうちに下記のような重複コンテンツが存在している場合があります。

  • wwwの有無や自動で生成されてしまうページ
  • 定型文でできているページ
  • Web用の印刷ページ

こういった「やむを得ない重複コンテンツ」については、最適化対応を行えば大きな問題にはなりません。(詳しい方法は、後述します)

多くのコンテンツを作成するようになると、ある程度内容が定型化してくるというのはよくあることです。そうなると、いつの間にか似たようなコンテンツを制作してしまい、重複コンテンツができているという可能性があります。

別ドメインに重複している内容(コンテンツ)のページがある

他のサイトとの間でコンテンツが重複しているケースです。自分のWebサイトの内容がコピーされてしまった場合や、自分で作成したコンテンツの質が低い場合に重複コンテンツとみなされる可能性があります。

コンテンツを作成するのが自分だけであれば気をつけることもできますが、外部のライターに依頼する場合等は、知識不足などで重複コンテンツになっているケースもあります。作成側もリテラシーを持って重複コンテンツにならないように注意する必要があります。

重複コンテンツとコピーコンテンツ

重複コンテンツは、「コピーコンテンツ」とも呼ばれます。コピーコンテンツの考え方や気をつけたいポイントについては、以下の記事で詳しく説明していますので、合わせてご覧ください。

重複コンテンツによるデメリット

重複コンテンツが存在すると、Googleのペナルティを始めとして、SEO的に大きなデメリットがあります。

ペナルティ対象となる危険がある

一番大きなデメリットは、Googleのペナルティ対象になる可能性があることです。現在のアルゴリズムにおいて、Googleは「コンテンツの質」を特に重視しています。特に注意したいのが、「無断複製されたコンテンツ」です。これは悪意のある重複コンテンツと判断され、ユーザーの利便性を損ねてしまいます。そのため、Googleのペナルティ対象となり、検索順位を大きく下げるリスクがあります。

Google公式サイトにおける「無断複製されたコンテンツ」の例は以下のとおりです。

  • 他のサイトのコンテンツをコピーし、独自のコンテンツや付加価値を加えることなく転載しているサイト
  • 他のサイトのコンテンツをコピーし、(語句を類義語に置き換えたり自動化された手法を使用したりして)若干の修正を加えた上で転載しているサイト
  • 何らかの独自の体系付けやユーザーへの利便性を提供することなく他のサイトからのコンテンツ フィードをそのまま掲載しているサイト
  • ユーザーに実質的な付加価値を提供することなく、他のサイトの動画、画像、その他のメディアなどのコンテンツを埋め込んだだけのサイト

引用元:Google公式サイト

もし、これらに該当するコンテンツを掲載している場合は、すぐに対応しましょう。

検索結果への表示が阻害される

原則として、重複コンテンツとみなされたページは、同時に検索結果に表示されることはありません。検索エンジンは、ユーザーが求める情報をわかりやすく提示することを目的にしているので、コンテンツの中身を判断し、多様な情報を表示しようとします。

そのため、同じような内容のコンテンツがWeb上に複数存在する場合は、もっともふさわしいと判断したものを検索結果に表示させるアルゴリズムが働きます。

似たようなページがたくさんあると、それらのページがクロールされる可能性が減り、結果として検索結果に露出しにくくなってしまいます。コンテンツをいくら作っても、ユーザーに届かない…という状況になるかもしれません。

評価が分散される

重複したページがあると、本来なら1つのページに与えられる評価が分散する可能性があります。どのように評価されているかを確かめるのは難しいですが、もし評価が分散される状態が続くのであれば、Webサイト全体の上位表示の妨げにも影響するかもしれません。

重複コンテンツを調査する方法

重複コンテンツについては、対応が必要ということはおわかりいただけたと思います。しかし、Webサイトのコンテンツが豊富になるほど、「どうやって探したら良いかわからない…」「自分のWebサイトに問題がないか、どうやって判断すればいいかわからない…」という状態になりますよね。そこで、簡単に重複コンテンツを探す方法をご紹介します。

Google検索を行う

一番素早くできる方法です。検索エンジンで自社のコンテンツの内容を検索してみましょう。コンテンツの一部をコピーして、検索ボックスにペーストして検索します。その結果、自社のものではないページが上位表示された場合、重複コンテンツとみなされている可能性があります。

このとき、過去の閲覧ページに検索結果が左右されないようにするために、「シークレットモード」で検索することをオススメします。その方が、正しい結果を確認できます。(Googleの場合、通常の検索結果は閲覧履歴や地域に基づいたパーソナライズド検索になっているため、自分のWebサイトが表示されやすくなっている可能性があります)。

sujiko.jpを活用する

重複している可能性があるページが見つかったら、どの程度重複しているのかを具体的にチェックしていきましょう。ページが分かっている場合におすすめのツールは、「sujiko.jp」です。

引用元:sujiko.jp

当該ページのURLを入力して判定ボタンを押すだけで、ページの類似度を表示してくれます。アカウントの登録作業は不要、無料で使えます。対応が必要なページが複数ある場合は、このツールで調査して優先度を決めると良いかもしれません。

Sujiko.jpはさらに便利な機能もあって、「サイト内類似ページ判定」を使うと、入力したサイト内に重複ページに該当しそうなページがないかをチェックしてくれます。「サイト外類似ページ判定」を使うと、入力されたURLと似ている可能性があるページを自動的に抽出して調査してくれます。サイト内類似ページ判定・サイト外類似ページ判定は1日5回の利用制限はありますが(登録で無制限になります)、上手に活用することで重複コンテンツ調査を効率的に進められます。

Copy Content Detectorを活用する

引用元:Copy Content Detector

まだアップする前のコンテンツのチェックをしたい場合など、URLが不明(未定)のテキストについて重複チェックをしたいのであれば、Copy Content Detectorがおすすめです。調査したいテキストをブラウザに貼り付けてボタンを押すだけで、類似度の判定をしてくれます。

外部のライターを取り入れている場合などは、コンテンツの質の担保が大きな課題になりますよね。内容の確認フローの中でこのツールを取り入れると、簡単にコピペチェックを完了させることができ、重複コンテンツのアップを未然に防ぐことができます。

他にも、文章の簡易校正機能(漢字の間違いや文章の間違いを見つけやすくする機能)も使えるので、普段のコンテンツ作成に取り入れて記事の精度を高めるために使えます。

重複コンテンツへの対策方法

では、重複コンテンツを見つけたらどのように対応すればよいのか、具体的な方法をご紹介します。

URLの正規化をする

同じページに複数のURLが存在している場合(wwwの有無やhttpとhttps、index.htmlとindex.phpなど)にやるべき対応です。この場合、メインのURLを一つ決めて、「これが正しいURLです」という情報を検索エンジンに伝える作業が必要です。この作業を「URL正規化」と言います。

URL正規化には以下2つの方法があるので、状況に合わせて選んでください。

301リダイレクト

ユーザーにとって複数のURLが必要ない場合(wwwの有無、index.htmlとindex/php、末尾のスラッシュの有無)は、301リダイレクトを行います。ユーザーがアクセスするURLは一つ指定していれば問題ないので、その他のページについては「URLが移転した」という扱いにするのです。301リダイレクトは、転送前のページの評価も引き継ぐことができるので、SEO的にも効果的です。

301リダイレクトの詳しく設定方法については以下の記事をご覧ください。

canonicalタグによる正規化

サーバーによっては、301リダイレクトの設定ができないケースもあります。その場合は、canonicalタグを利用してURLの正規化を行います。

canonicalタグは、スマホページとPCページがある場合、商品のサイズや色ごとにURLがある場合など、ユーザーがそれぞれのページにアクセスできる状況をキープしなくてはならないケースにも有効です。

残しておきたい正規URLを決めたら、それ以外の重複コンテンツページのタグ内に、rel=”canonical”を記述します。

canonicalタグの詳しく設定方法については以下の記事をご覧ください。

アノテーションを行う

スマホ用とPC用で別のURLを設定している場合は、URLの正規化以外にも「アノテーション」という対応ができます。アノテーションとは、デバイスごとに最適化された複数のURLがあることを、検索エンジンに認識してもらうための作業です。先述したcanonicalタグを使うのに合わせて、link rel=“alternate”の設定も行います。

まとめると、下記の作業を行いましょう。

  • PC用ページにはlink rel=“alternate”を記載し、そのページにはスマホ用の別ページが存在することを伝える
  • スマホ用ページにはcanonicalタグを記載し、PC用ページが正規のURLであることを伝える
  • コンテンツを削除する

    同じようなコンテンツがサイト内に存在している場合、思い切って削除してしまうというのも有効な方法です。ページ削除まではしたくない場合は、タグ内のmeta要素にcontent=”noindex”を設定しましょう。こうすると、指定したページがクロールされず、検索結果に表示されなくなります。

    noindexの詳しく設定方法については以下の記事をご覧ください。

    外部サイトに記事を提供している場合の対応

    他のサイトにコンテンツを提供している場合は、オリジナルコンテンツが自分のサイトであるということを示すためにも、提供先のページにcanonicalタグを設置してもらうことが望ましい対応です。しかし、外部サイトのことなのでコントロールが難しいです。相手先も、提供記事のリンクを集められている状況なので、URLの正規化に協力してくれる可能性も低いです。

    ですので、最低限の対応として、提供先のページからオリジナルコンテンツへのリンクを設置してもらうようにしましょう。例えば、「提供:デジタルマーケティング研究所」という形でリンクを設定してもらうという形です。こうすれば、自分のサイトがオリジナルということが検索エンジンに伝えられるはずです。

    他のサイトにコンテンツをコピーされた場合

    最後に、盗用されたコンテンツがオリジナルと判断されてしまった場合の対応をお伝えします。(今はコピーコンテンツ対策を行っているサイトも多いので、この可能性は稀かもしれません。)

    この場合は、重複コンテンツというよりも著作権の問題です。盗用をしたサイトの運営者に削除要請を行い、さらにGoogleにもインデックスから削除するよう依頼しましょう。削除要請は、Googleの著作権侵害による削除フォームから行えます。いざという場合に備えて、対処方法を頭の片隅においておくと安心ですね。

    おわりに

    重複コンテンツは、放置するとペナルティを受ける可能性があり、評価が分散して検索順位が上がりにくいなどのデメリットがあります。自サイトをチェックして、重複コンテンツに該当するページがあった場合は、適切に対応を行いましょう。検索エンジンにインデックスされるページを絞る(一つ一つのコンテンツの質を高める)ことで、サイトの価値も高まり、検索順位が上がることが期待できます。

    コンテンツが増えてきたタイミングで、一度重複コンテンツのチェックを行ってみてください。

     

    • このエントリーをはてなブックマークに追加
    The following two tabs change content below.
    digital-marketing

    digital-marketing

    デジタルマーケティング研究所では、デジタルマーケティングの施策・広告・技術を、分析・実装・検証して、WEB担当者・マーケティング担当者の方の役立つ情報を発信していきます。