今回は、サイト運営の初心者の方に向けて、<meta name=”robots”>の正しい使い方について分かりやすく解説します。
<meta name=”robots”>とは<head>内に記載することで検索エンジンのクローラの動作を制御することができるタグです。上手に活用することで、検索結果へ思い通りに自分のサイトを露出することができるようになります。
難しいと思われるかもしれませんが、基本的な考え方を理解してしまえば、記述自体もシンプルなものなので、すぐにサイトに取り入れることができます。WebサイトのSEO効果を高めるためにも、ぜひ取り入れてみてください。
目次
まずは、「<meta name=”robots”>とはなにか?」という基本的な知識をおさえておきましょう。
<meta name=”robots”>とは、HTMLの<head>タグ内に記載するメタタグの一種です。メタタグとは、メタ要素とも呼ばれ、Webページの情報を検索エンジンやブラウザにインデックスすることを拒否したり、キャッシュを拒否したりと、クローラーの動作を制御する役割を果たします。<head>タグ内に記載されるので、サイトを訪問するユーザーからは直接見えることはありません。(一方、ユーザーが目にするコンテンツ部分は、<body>タグ内に記載します)
メタタグにはさまざまな種類があります。一例を示すと、下記などが有名です。
Webサイトの概要をまとめたテキストの内容を指示する。検索エンジンの検索結果画面に示される。
そのページの内容を表すキーワードを記載する。現在のSEO上では不要とされている。
<meta name=”robots”>は、メタタグの中でも「検索エンジンのクローラ(サイトの内容を読み取るロボット)の動きを制御する」という役割を果たします。例えば、「このページをインデックス(検索結果に掲載)しないで」という指示を送ることができます。この内容を低品質なページやユーザーにとって価値の低いページに指定しておくことで、SEO上の悪影響を防ぐことができるというわけです。
タグの中に「robots」という記載があるのを見て、「robots.txt」の存在を思い出された方もいるかもしれません。
robots.txtは主に検索エンジンの巡回を支持するファイルです。クローラが一番始めに確認する場所で、クロールすべき場所とそうではない場所を確認し、効率的にサイトを見る手助けを行います。robots.txtの詳細については、以下の記事をご覧ください。
<meta name=”robots”>とrobots.txtは、どちらも検索エンジンのクローラに指示を行って、読み込まないページを設定することができます。しかし、robots.txtでの指定はロボットのアクセスそのものを禁止するという点が違います。
検索エンジンの仕組みとしてまず確認するのはrobots.txtです。つまり、robots.txtでクロールをブロックしているページについては、いくら<meta name=”robots”>の記載をしても無意味ということになります。そもそも検索エンジンに読み取ってもらえないからです。
例えば、すでにインデックスされているページをインデックス除外したいような場合には、robots.txtを使うのではなく<meta name=”robots”>で指定するというのが正しい判断ということになります。robots.txtでブロックしてしまうと、ページに行った変更(インデックス除外)も適用されないからです。
間違って併用しないよう、注意しておきましょう。
<meta name=”robots”>タグでできることをまとめると、大きく以下3つに分けられます。
以下、それぞれの意味と設定方法を詳しく解説していきます。
※ちなみに、上記3つに加えて以前はnoodp,noydirという指示も存在しました。これは「有力ディレクトリ登録文をスニペット(SERPsの説明文)に流用することの拒否」という意味の指示です。しかし、現在はディレクトリ登録サイトが閉鎖されてしまっているため、記述する必要はないとされています。ですので、この記事では詳しい説明を行いません。
指定したページのインデックスを拒否することができます。
具体的には、<head>内に以下のように記述します。
こうすることで、記述したページはクローラが検索結果に反映させることはありません。robots.txtとは違ってロボットはページ自体の内容の確認を行います。単に検索結果に表示されなくなることがあります。
この記述を使うのは、検索結果に出したくないページがある場合です。例えば、テキスト量の少ない低品質なページや、複製コンテンツとして扱われそうなページが該当します。
指定したページのキャッシュを拒否(検索エンジンデータベースへの保存の拒否)することができます。
具体的には、<head>内に以下のように記述します。
利用するシーンとしては、ECショップや会員制のサイトなど、頻繁に情報が更新されるページが挙げられます。ユーザーが何らかの表紙にキャッシュを閲覧してしまうと、古い情報を見て混乱してしまうケースが想定されるからです。
その他、Internet Archiveのようなサービスにキャッシュを取得されたくない場合にも利用することが考えられます。
ページからのリンクを評価の対象としないように支持することができます。リンクに関してはすべて「rel=”nofollow”」が記述された状態になるようなものとイメージすると分かりやすいと思います。
具体的には、<head>内に以下のように記述します。
信頼できないコンテンツや有料リンク、検索エンジンがたどる必要のないリンクが掲載されているページにnofollowを設定しておくことで、ページのリンクの質を高めることが期待できます。質の低いリンク先は、ユーザーや検索エンジンにとって価値のないリンク先とみなされる可能性があるので、そのままでは検索順位に悪影響を与える可能性があります。
例えば、「このページはスパムリンクなので、注意してください!」と有益な情報を発信したにもかかわらず、検索エンジンから「悪質なリンクを張っているから評価を下げよう」と認識されてしまったら悲しいですよね。こういった事態を防ぐことができるのもこのタグです。そこでnofollow指定を上手に活用してページの価値を維持しましょう。
他にも、サイトマップページに表示されているのがほかページへのリンクばかりで、検索エンジンからスパム認定されないか不安という場合にも、このタグを使うことでリスクを減らすことができます。
<meta name=”robots”>でできることやどのような時に設定すべきかはお分かりいただけたと思います。次に、実際にタグ内に記載するときに注意すべきポイントを5つご紹介します。
nooindex、noarchive、nofollowの3つの設定を行うことができますが、複数の設定を併用したい場合はひとまとめにできます。例えば、以下のように記載します。
併用したい内容を、カンマ区切りで併記します。このとき、カンマの後にスペースが合ってもなくてもどちらでも認識されます。
ちなみに、nofollowとnoindexの両方を指定するときは、noneという指示で代用が可能です。
この2つは、同じ指示として処理されます。
記載する内容について、大文字と小文字とどちらで記載しても指示の内容は変わりません。
例えば、以下の3つはいずれも同じ内容として処理されます。
ただ、一般的に小文字で書くことが想定されているので、基本的には小文字表記をオススメします。
noindex,nofollowに関しては「許可する」といった意味合いの記述も可能です。
例えば、下記の記載がこれに当たります。実際、上の記述を書いているサイトも存在します。
しかし、この記述は不要です。なぜならクローラの巡回もリンク先の参照もデフォルトでは「許可」されているからです。ですので、わざわざ記述する必要はありません。ファイルサイズも(わずかではありますが)大きくなりますし、無駄な記述は極力避けてシンプルなソースコードを目指してください。
記事の前半でもお伝えしましたが、robots.txtのブロックと併用しないように注意をしましょう。robots.txtでクロールをブロックしているページについては、いくら<meta name=”robots”>の記載をしても意味がないからです。
特に注意をしたいのは、「すでにインデックスされているページをインデックス除外したいようなケース」です。このときにRobots.txtを使うと、ページに加えた変更(インデックス除外)そのものも適用されないことになってしまうからです。この場合は<meta name=”robots”>で指定するようにしましょう。
robots.txtと併用してしまうと思わぬトラブルのもとになりかねませんので、身長に判断することが大切です。
「ページは検索結果に反映してほしくないけれど、リンク先の評価は受け渡してほしい」という要望がある場合には、注意が必要です。
どういうとことかと言うと、「noindex,follow」と指定していたはずでも、長期的に見ると「noindex,nofollow」と同等の扱いを受けることがあるからです。タグの記述内容と実際のクローラの動きに違いが出てくるので、Googleによってこういった扱いを受けるということを頭に入れておきましょう。
もちろん、設定された当初から「noindex,follow」と「noindex,nofollow」が同じものとして扱われるわけではありません。初期の段階では、インデックスに保存しつつも検索結果には表示せず、リンクはたどるという対応を行います。しかし、noindexがずっと設定されていると、クローラが「このページは検索に不要なページだ」と判断し、インデックスそのものから削除し、リンクも辿らなくなります。
結果として、「noindex,follow」と「noindex,nofollow」は同じ扱いを受けるようになります。わざわざ指定しようと考えていた方は、間違わないようにしましょう。
<meta name=”robots”>を活用すると、検索エンジンの動きを制御でき、SEO上でもさまざまなメリットを得られることが期待されます。メタタグの設定はWebサイトの見た目には反映されませんが、SEO効果を高めるためにも適切に設定しておきたい部分です。この記事を参考に、<meta name=”robots”>設定を取り入れていただければと思います。
この記事をご覧いただいている皆様へ。 このページは、SEO情報ブログ「ディーエムソリューションズの社員が作った、【SEOまとめ】」にて公開さ…
この記事をご覧いただいている皆様へ。 このページは、SEO情報ブログ「ディーエムソリューションズの社員が作った、【SEOまとめ】」にて公開さ…
アクセスアップの方法として、多くの企業がSNSを使った情報発信をしているのではないでしょうか?上手に活用できると、情報がシェアされ、ターゲッ…
「重複コンテンツ」とは、コンテンツ内容が他のページの内容と重複しているものを指します。 Googleが低品質なコンテンツとみなすものの一つに…
SEO経由の流入数を増やしたいのであれば、「どのキーワードで上位表示を狙うか」というキーワード選びを強く意識する必要があります。 よく検索さ…
SEOで上位表示をするためにも、おすすめしたいのがGoogleサーチコンソールのサイトマップ送信です。 Googleサーチコンソールにサイト…