SEO対策やサイト・ブログ運用をしていると「インデックス」というワードをよく耳にする方が多いのではないでしょうか?インデックスは、これからもSEO対策やサイト・ブログ運用を継続していく上で抑えておきたい基本のひとつです。
よく聞くけど意味はわからないという方やなんとなくはわかるという方に向けて、本記事ではインデックスに関わる検索エンジンの仕組みやインデックスについて解説していきます。
まずは、検索エンジンの仕組みについてご紹介いたします。
検索エンジンとは、検索窓にキーワードを入力して検索することで、インターネット上に存在しているWEBページや画像などの情報を一覧で表示させて、情報を探すことができるシステムのことを言います。
日本で利用されている検索エンジンにはGoogleやYahoo!、bingといったものがありますが、その中でもGoogleとYahoo!の検索エンジンが利用者の大部分を占めています。検索エンジンは「クローリング」「インデックス」「ランキング」と大きく3つのステップに分かれており、以下で細かく説明していきます。
クローリングとは、クローラーという検索エンジンのロボット(Googleボットなどがある)が、WEB上を巡回して情報を取得することを言います。クローラーがまわってきたときにはじめて、ページの存在を認識することができます。
インデックスとは、索引や見出しのことを言いますが、検索エンジンにおけるインデックスはクローリングして取集したページ情報をデータベースに分類・登録することを言います。
検索キーワードとの関連性の高いページを選び、その中で順位をつけて検索結果に表示することをランキングと言います。ランキングは検索エンジンのアルゴリズムにより決められます。
クローラーがページを認識して、収集した情報をデータベースに格納されることをインデックスと言います。
検索結果に表示されるページ情報は、このインデックスされているデータをもとに表示されています。インデックスされていないとページを認識されていないことになりますので、当然検索結果にも表示されません。
クロールされたページはすべてインデックスされるわけではなく、中にはクロールできないページも存在しています。例えばサイト管理者がrobots.txtでブロックしていたり、パスワードで保護されていたりするページはクローラーが巡回できないようになっています。また中身が同じでURLだけが違うといった重複しているページについては、代表となる1ページのみのインデックスとなり、そのほかの同じ内容のページはインデックスされません。
こちらの意図とは関係なくインデックスされない例もあり、例えばコンテンツの品質が悪いページ(薄っぺらいページ)など、ユーザーにとって価値が低いページはインデックスされないことがあるため注意が必要です。また、ユーザーには見てもらいたいけれど検索結果に表示させたくないといったページには、noindexを設定してインデックスさせないようにすることもできます。このようにどのようなページでもクロールされ、インデックスされるわけではありません。
検索エンジンがページの存在を認識してからどのくらいでインデックスされるかについては実は明確な答えはありません。クロールされてからすぐにインデックスされるときもあれば、時間がかかるときもあります。現在、一般的には数秒から数分程度と言われており、数週間かかることもあると言われています。
ただし、更新頻度が低い中小規模のサイトはクローリングの頻度が低い傾向にあります。また、公開されたばかりの新規サイトもクローラーの巡回頻度が低いため、クロールされてからインデックスされるまでに数日から数週間かかることもあります。
公開したばかりの新規サイトなど、インデックスされていないということはそのサイトを見つけられていない状態ですので、どれだけサイトを更新してSEO対策を行ったとしても検索結果に表示されないといったことになります。このようにインデックスとは、SEO対策やサイト・ブログ運用をしていく上で必要な工程と言えます。
ここまでで【インデックスされていない=検索結果に表示されない】という重要なことを解説してきました。こちらからは自分のサイトがインデックスされているかどうかを確認する方法についてご紹介していきます。
かつては「Info:」検索というGoogleがインデックスしている正確なURL(正規URL)を調べることができましたが、現在は廃止され使えなくなっています。そのため現在、インデックスされているかの確認をする場合は以下のような方法となります。
1つずつしか確認することができません。
対象となるサイトのサーチコンソールの管理権限が必要になります。
サイト内検索に用いられている特殊検索機能のひとつです。
しかし、リダイレクトを行ったページなどで古いURLが検索結果に表示されることがあるため、すべて正確なページというわけではないことがあります。
サーチコンソールのカバレッジレポートでは、サイト内の各ページのインデックス状況を確認する方法です。この方法ではインデックスさせたいページがインデックスされていないといった不具合の確認ができます。ほかにもエラー内容の確認でインデックスされているがサイトマップには記載されていない、といったことも確認することができます。
確認手順としてはサーチコンソールのカバレッジをクリックするとレポートが表示され、エラー、有効(警告あり)、有効、除外の4つの項目に分かれています。以下にて各項目を詳しくご紹介します。
インデックスに対する様々なエラーをここから確認することができます。サーバーエラーやリダイレクトエラー、robots.txtやnoindexによるエラー、ステータスコード404といった存在しないページエラーなどの詳細を参考にすることで、インデックスに対して対応することができます。
詳細の「エラー」をクリックすることで上記のようなページに移動します。エラーの対応が完了したら「修正を検証」をクリックして更新するようにしましょう。尚、反映までには数日かかることがあります。
有効(警告あり)については、robots.txtでクロールをブロックしているのにも関わらず、インデックスされたときに表示されます。robots.txtによるブロックはクローラー自体に対するものではありませんので、リンクが設置されていればクローラーは巡回します。必要に応じ、noindexの設定をすることでこのような警告もされないようになります。
クローラーの最適化(クローラビリティ)を行う上では、改善する方がいいと言えます。
有効は正常にインデックスされている状態を示していますので、こちらからインデックスされていることを確認することができます。
除外はインデックスされていないページを示しています。エラーと違う点は、意図的にインデックスさせていないと考えられるページが表示されていることです。noindexやrobots.txtにてブロックしていたり、404エラーページやリダイレクト元のページだったりといった管理者が意図的にインデックスさせていないと思われるページがここで表示されます。
インデックス数を確認する方法として、正確な調べ方はサーチコンソールのURL検査ツールで対象のページのインデックスステータスを見ることです。しかし、1つずつでしか確認することができないといったデメリットがあります。
そこでおすすめなのが、「site:」検索です。「site:」検索は、サーチコンソールを使わずにインデックス数を調べることができるため、非常に手軽です。
ただし、先ほど記述した通り、この「site:」検索はすべてが正しいとは限らないため参考値になります。本来、サイト内検索のために用いられている「site:」検索ですが、意味を理解していればインデックスのだいたいの数を調べるために使うこともできます。
インデックス数の多さがそのままSEO効果に反映されるわけではありません。どれだけページのボリュームが多かったとしても一つひとつのページの品質が悪ければ、その半分のボリュームで品質の高いサイトが評価されるでしょう。
Googleの「ユーザーにとって有益で質の高いコンテンツを提供すること」という考え方があり、特に近年では良質なコンテンツを提供しているサイトが評価されている傾向があります。
文字数を少なくしたり、1つの記事を数記事に分けて作成したりといったインデックス数を増やすためだけを考えた対策では、SEO効果は得られないと考えた方がいいでしょう。
また、インデックス数をむやみに増やしすぎてしまい、サイト構成が複雑化すると下層のページが埋もれてしまい、インデックスから漏れてしまう可能性もあります。重要なページが適正な評価を受けられないようなことにならないように、しっかりとインデックスされるための対策を行うようにしましょう。
ここまででインデックスの大切さをご理解いただけたと思います。クローラーはリンクをたどってサイトからサイトへと巡回してインデックスします。リンクさえ貼っていれば、いずれはどこからかクローラーがたどってきてインデックスしてくれます。
しかし、すべてがクローラー任せというわけではなく、自分でインデックスを促進することもできます。手動でクローラーへインデックスを促す方法は以下4つになりますのでそれぞれ詳しくご紹介していきます。
Googleボットでは新しいページを見つけるときの基準として、リンクを重要視している傾向があります。クローラーがサイトを訪れてリンクを取得していき、次にリンク先のページをクロールしていきます。このようにクロールからインデックスされるのを促進することができます。
新規ページを作成したときは、最もクロール頻度が高いと言われているサイトの玄関、窓口であるトップページにリンクを貼り付けることがおすすめです。
サイトマップにはHTMLサイトマップとXMLサイトマップというものが存在します。HTMLサイトマップはサイト内のコンテンツを一覧にしたもので、主に訪れたユーザーに向けた物になります。XMLサイトマップはクローラーに向けたもので、基本的にはユーザーに見えることはありません。サイトの更新日や更新頻度を記述したファイルのことを言います。XMLサイトマップを設置することで、クローラーはサイト内を巡回しやすくなります。
このようにXMLサイトマップを設置してサイト情報をクローラーに伝えることで、インデックスを促進することができます。
サイトマップだけではなく、RSSフィードを活用することも大切です。XMLサイトマップはサイト内のすべてのページ情報を表示するのに対して、RSSフィードは更新されたページ情報のみが表示されます。
RSSフィードはWordPressを使用していればデフォルトで送信されるようになっていますが、サーチコンソールのサイトマップから上記のような画面からRSSフィードのURLを登録することもできます。
RSSフィードを活用されていない方は登録しておきましょう。
Fetch as Googleの後継であるサーチコンソールのURL検査ツールを使用して、インデックスを直接リクエストすることができます。サーチコンソールのURL検査をクリックして、URLを入力することでインデックスされているかを確認することができます。ここでインデックスされていない場合は、「インデックス登録をリクエスト」をクリックして、直接リクエストを送信しましょう。
また、ここでは更新した最新のページをすぐに反映させたいときに、インデックスされていなかったときと同じ方法で直接リクエストすることができます。そうすることで早くクロールされますので、インデックスの促進につながります。
しかし、日常的に使うようなものではなく、回数は明確にされていませんが1日の使用回数に対する制限もあります。重要な更新や修正があった際に活用するといいでしょう。
検索エンジンにインデックスされないと、検索結果に表示されません。そのためインデックスされると自然検索経由のSEO流入が見込めます。
インデックス数が多いからといって自動的に順位が上がることはありません。ユーザーにとって有益で質の高いコンテンツを増やすことがサイトの評価に繋がります。
インデックスされない原因を見つけ、改善する作業が必要です。Googleサーチコンソールで問題を探すことが可能です。Googleサーチコンソールでよく出るエラーの紹介は「Googleにインデックスされない…原因と8つの対策方法とは?」をご確認ください。
主な原因として、クローラーが巡回していないことが考えられます。また、更新頻度が低い中小規模のサイトや新規サイトはクローラーの巡回頻度が低いため、インデックスされるまでに時間がかかることがあります。
今は検索エンジンがJavaScriptを理解する精度が上がっていますので、問題なくインデックス登録することも可能です。ただしインデックスされないケースも発生しうるので注意が必要です。
検索エンジンの仕組みからインデックスについてご紹介してまいりました。
おさらいですが、インデックスとはクローラーが収集した情報をデータベースに格納することを言います。検索結果に表示される情報はインデックスされているデータを元に表示させているので、インデックスされていないと検索結果に表示されません。
インデックスを促進させるためには、内部リンクの設置やXMLサイトマップの送信、URL検査ツールなどを適切に活用していきましょう。
ディーエムソリューションズのSEOコンサルタント、犬塚と申します。 過去には、「SEOコンサルタントがこっそり教えるSEO施策のコツ」など、…
私たちがSEO事業をスタートした2006年のSEO施策は、現在の施策とは大きく異なるものでした。 人工的な外部リンクが隆盛を極め、とにかくリ…
皆さんはSEOを外注ではなく、自分で実施したいと考えたことはありませんか? 外部リンクによるSEOが終焉に近づき、コンテンツによるSEOが全…
みなさんはSEOにはブラックハットSEOとホワイトハットSEOと呼ばれる2つのアプローチがあることをご存知でしょうか?今回の記事ではブラック…
「WEBサイトの流入が増えない」「狙っているキーワードでの検索順位がなかなか上がらない」といったSEOに関する悩みを抱えているが、「原因が何…
日々進化し続けるGoogleのアルゴリズムに対し、最適化を図るSEO(Search Engine Optimization)もこれまでにいく…
今話題のAIによるコンテンツ自動生成機能も!SEO対策に本当に必要な機能だけを搭載した使いやすさとコストパフォーマンスに優れたWeb集客支援ツールです。
Webマーケティングに関わる施策全般をワンストップで
ご提供します。
お気軽にご相談ください。
Webマーケティング最新ニュースのレポートや無料セミナーの先行案内が届く、お得なメルマガ配信中!