404(404 not found)とは、クライアントからのリクエストしているページをWebサーバーが見つけられなかった時に返すHTTPステータスコードです。
Webサイトを見ていると、たまに「404 not found」「お探しのページは見つかりませんでした」というメッセージが書かれたページに出くわすことがありませんか?このページのことを、404エラーページ(404 not found)というのです。
今回はこの404エラーページについて、原因やSEOへの影響、対策方法まで、404エラーページを知り尽くせるよう、幅広くご紹介したいと思います!
目次
そもそも「404エラー」ってなに?という方はお読みください。知っている方はスクロールして飛ばしましょう。404エラーは別名で「HTTPステータスコード404」「404 Not found」とも言います。
クライアント(Webブラウザ)からのリクエストに対する、Webサーバーからのレスポンスの状態を示す3桁の数値です。わかりやすく言い換えると、私たちが「ブラウザ(画面)にこのページ表示したいよー」というお願い(リクエスト)に対して、Webサーバーがどんな対応(レスポンス)をとったかを表す数値です。
ステータスコードは大きく分けて100番台、200番台、300番台、400番台、500番台に分かれています。
100番台 | リクエストに対し、処理が継続されている状態 |
---|---|
200番台 | リクエストを正しく受理し、完了した状態 |
300番台 | リクエストを達成するために、リダイレクトや移行など追加の処理を必要としている状態 |
400番台 | リクエストが正しく処理できない状態 |
500番台 | サーバーに問題があり、エラーとなっている状態 |
さらに、ステータスコードの3桁の数値は200、301、302、503など色々な数値に分かれています。例えば、200はいわゆる正常(問題もなくページを表示できた)、301、302はリダイレクト(ここにはいないよ、移動したよ)ということを表しています。また、400はリクエスト内容にエラーがあり不正扱いされている、500はサーバー内で問題が発生しており正常にレスポンスできない状態、ページが見れない状態を表しています。
エラーコードといっても内容は様々で、クライアント側の問題の時も、サーバー側に問題がある場合もあります。その数あるエラーコードの一つが404というわけです。
「404」もとい「404 not found」は、クライアントからのリクエストしているページをWebサーバーが見つけられなかった時に返すコードです。Webサーバーに「あなたが見たいページ、探したけど見つからないんですけど、ほんとにあるの?」と言われている状態です。
この「ページが見つかりませんでした」ということを伝えるために表示されるページが、404エラーページです。
ユーザーは無効なリンクをクリックしたり、誤った URL を入力したりして、サイト上に存在しないページにアクセスしようとすることがあります。ユーザーをサイト上の公開中のページに導く親切なカスタム 404 ページ30を用意することで、利便性を大幅に改善できます。
引用:「検索エンジン最適化(SEO)スターター ガイド」より
なぜ404ページが必要かと言うと、ユーザーが迷わないためです。間違ったURLや既に終了(削除)されたページであることをユーザーに理解させたうえで、サイト内の回遊を促します。
404ページがあることで、次のアクションをユーザーに促すことができます。
では、なぜ404エラーが起こるのでしょうか?起こりうる主な原因をご紹介します。
もともとあったページが削除されているにも関わらずそれを知らずにアクセスしてしまうと、404エラーになってしまいます。ページそのものがなくなってしまったので、見つからないわけです。
アドレスバーに手動でURLを打ち込む際、URLのスペルを見間違えたり、打ち間違えたりすることがあると思います。そうすると、そもそも存在しないURL(場所)を表示させようとしているため、表示できないですね。
リンク先のページが見られないリンクのことをリンク切れと言います。リンク切れのパターンとして挙げられるのが、先に挙げた2つです。
1つ目が、リンク先のページが削除されているパターン。リンクを貼った時はページが存在していたのに、いつの間にかページがなくなっていた…ということはよくあります。新しいページのURLに貼りかえるか、リンクそのものを削除する必要があります。
2つ目が、設置したリンクのURLが間違っていたパターン。設置されたリンクのURLが間違っていたり、存在しないページにリンクが貼られていると、そのリンクをたどった人全員に影響します。リンクを設置する時は、リンク先に問題がないか確認しましょう。
ページが削除された場合や、ドメインを変えてURLが変わった場合には、古いURLから新しいURLに対して301リダイレクトの設定を行い、ユーザーが新しいURLに自動でたどり着くようにします。
このリダイレクトの設定に不具合があった場合、新しいURLにアクセスすることができないため、404ページになってしまいます。リダイレクトの設定は正しく行う必要があります。
なお、ドメインの変更によりリダイレクト設定がうまくできていない場合には、外部リンクの効果を引き継ぐことができなくなるため、機会損失をしている可能性があります。
そのため、ページを統合する際には注意しましょう。
404と合わせて注意したいのが、ソフト404です。
ソフト404とは、ページを開いた際に404と同じように「ページが見つかりません」と表示されますが、ステータスコードをチェックすると404ではなく、200と表示されページが正しく処理されている状況です。つまり、意図しないページが存在している状況です。
検索エンジンからするとページが存在していると認識をしている状況なので、通常のページと同様にクロールします。そのため、存在しないページがクロールされることになり、本来クロールされるべきページのクロールが遅くなったり、クロール頻度が下がる可能性があります。
これによりすぐにサイトの評価が大きく下がることはありませんが、ソフト404のページが常に大量に発生しているサイトの評価を下げる可能性もありますので注意する必要があります。
404エラーページはそのままだと、「ページが見つかりませんでした」ということを伝えるだけのページになります。
この404エラーページですが、表示させるページを自分が作成したページに変更することができます。それがオリジナル404エラーページです。
オリジナルの404エラーページをつくることは、以下のようなメリットがあります。
「404エラーが起きた=ユーザーが見たいページが見れなかった」というのが404エラーの現象です。
つまりユーザーが404エラーページにたどり着いた際に必要としているのは、どうやったら見たいページを見れるのか、見たいページがないのであれば、代わりになるページはあるのか、という問題に対する解決策の要素なのです。
この要素がないと、ユーザーは残念ながら、あなたのサイトから離脱してしまうでしょう。もしかしたらサイトそのものがなくなったと思い、二度と訪れないかもしれません。
逆に言えば、訪れた404エラーページが便利で魅力的なものになれば、ユーザーは今まで以上にサイトを見てくれるかもしれません。そこで、必要なのが、オリジナル404エラーページというわけです。
一方で、この404エラーページ、SEOにはどう影響があるのでしょうか?気になるところだと思います。
一般的には404エラーが存在すること自体にSEOの影響はないと言われています。なぜかと言うと、過去Googleが公式ブログで以下のようにコメントしているからです。
サイトの一部の URL が既に存在しない、または 404 を返していた場合も、サイトの他の URL (200(Successful)を返すもの)の検索結果内での掲載順位には影響しません。
参考:Google ウェブマスター向け公式ブログ「404 はサイトに悪影響を与えますか?」
404エラーというものはどうしても起こってしまう、当たり前の現象です。
自社サイトならともかく、外部サイトから貼られたリンク切れはどうしても完璧に対処できるものではありません。そのため、404エラーページの存在そのものは順位に影響するとは言えないでしょう。
しかしこれは「404エラーが存在すること」に関するお話です。404エラーに対して、何もしなくてもいいというわけではありません。
その理由が、Googleの「検索品質評価ガイドライン」です。Googleは、品質の高い検索結果を表示できているかどうかを第三者に評価してもらい、その評価を改善に使用しています。
その評価をしてもらう際にGoogleが第三者に提供しているのが、検索品質評価ガイドラインです。つまり、Googleが高評価するサイトの項目、低評価にするサイトの項目がこのガイドラインでわかるというわけです。
参考:Googleの検索品質評価ガイドライン
(全文英語なので、404ページの記載については下記に要約しております。)
このガイドラインによると、50ページ目の項目に404エラーページについて書かれています。
50ページ目の項目「10.2 Ratings for Pages with Error Messages or No MC」
(訳:10.2 エラーメッセージやメインコンテンツの内ページに対する評価)
Googleは404エラーページの内容によって、それぞれ低・中・高の評価を行います。
広告ばかりが目立ち、ユーザーと助けようとする努力が見られない、MC(メインコンテンツ)がない。つまり、広告を見せることが目的になっている。またはエラーメッセージがない。
エラーがあることだけ、最低限しか伝えないページになっている。つまりそれ以上にユーザーの手助けになる情報がない。
まとめると、「ユーザーに対して助けの手を差し伸べているか」「制作者がエラーページに対して、時間と努力を費やし、手間をかけているか」が大きな判断基準となります。つまり、404エラーそのものの改善よりも、ユーザーにとって役に立つ、オリジナルの404エラーページを作成することが、SEOにとっても重要とも言えるのです。
また、オリジナル404エラーページを作成することは、ガイドライン記載の評価以外でも、SEOに関係することがあります。それは、 検索エンジンのクローラーへの影響です。
検索エンジンのクローラーも、ユーザーと同じくサイトを回遊していて、404エラーページに行き着くことがあります。
エラーページを作成しなかった場合、デフォルトの404エラーページは「404 not found」と書かれただけのページで、そのページからはどこにも遷移できません。そのため、クローラーがそれ以上サイトを回遊することができなくなるのです。
クローラーが行き止まりにばかり行き着いてしまうと、クローラーに本当に見て欲しい重要なコンテンツのあるページに辿りつけないかもしれません。サイトを正しく評価してもらうためには、オリジナルエラーページをつくり、クローラーの回遊率を高めることを意識することも大事なのです。
では、ユーザーにとって役に立つオリジナル404エラーページにするには、具体的にはどういったコンテンツを入れ込めばいいのでしょうか?
様々な404エラーページやGoogleの品質評価ガイドラインの内容を元に、必要なコンテンツを洗い出してみました。
では、どのようなページのデザインがいいのか、デジ研を例にあげて見ていきましょう。
「ページが見つからない」ということを伝えないと、ユーザーがなぜこのページに行き着いたかわからなくなってしまいます。そのため、赤枠「指定されたページが見つかりませんでした。」のようにエラーメッセージを必ず含めましょう。
サイトから404エラーページに遷移した際にまったくデザインが異なるページに辿りついてしまうと、ユーザーは違うサイトを開いてしまったのかと混乱してしまいます。グローバルナビゲーションやサイドカラムをサイトのデザインと合わせるなど、ユーザーがまだサイト内にいることを表現してあげましょう。
探したページが見つからなかったユーザーに対し、再度サイト内を探してもらいやすいようにグローバルナビゲーションやパンくずリスト、そして、「トップページへ戻る」などトップページへのリンクを設置しましょう。
サイトの規模が大きいと、トップページからページを探す場合、時間がかかってしまうかもしれません。
ユーザーが求めているコンテンツを探しやすくするには、サイトマップを設置すると良いでしょう。
自分が探しているカテゴリのページにすぐに遷移することができます。
更に、そのページでサイト内検索ができると、より探す手間が省けユーザビリティが高くなります。
404エラーページの要因の一つとして、ユーザーが見ようとしたページが既になくなっている可能性もあります。もしかしたらユーザーがもともと求めていたコンテンツがサイトに存在しないかもしれません。
閲覧数が一番多いページや、おすすめコンテンツへのリンク、最近投稿した記事へのリンクを貼り、サイト内を回ってもらえるように誘導しましょう。
各項目で紹介したデジ研の例をまとめると下記のような内容を設定しています。
まず、「ユーザーに対し、アクセスしたページが見つからなかったことを明確に伝えるエラーメッセージ」を「指定されたページは見つかりませんでした。」と大きく表記して伝えています。
また、「本サイトと合わせたデザイン」にし、ユーザーがまだ同じサイトへいることを表現しています。
さらに、「トップページへのリンク」や「サイト内検索」、そして「最近の記事」を設定し、ユーザーが違うページへ訪れることができるように設定しています。
ここからはデジ研以外のサイトでデザインの参考になる、魅了的な404エラーページの例をご紹介したいと思います。
こちらは有名なオリジナル404エラーページです。
自社商品の消しゴムを使い、「消しゴムがページを消してしまったのかもしれません」というジョークと共に、自社商品へのリンクをさり気なく貼っている、とてもユニークなページになっています。デザインもおしゃれですね。
不動産情報サイトなので、ユーザーが再度物件を探しやすいようにサイト内検索フォームを目立たせています。キャラクターや物件数No.1の表記等、ブランドアピールもしっかりしています。
こちらもご存知の方は多いのではないでしょうか。
少し長めのユニークなエラー文章と共に、おすすめコンテンツの一覧が表示されます。
Facebookの代名詞でもあるいいね!のマークの指に包帯が巻かれています。
シンプルですが、デザインに遊び心があって、ユーザーの興味をひきますね。
サントリーのコーポレートサイトです。トップページ、サイトマップ、サイト内検索、おすすめページと、ユーザーに必要な要素がしっかり詰まっています。水が見つからないというマークも、サントリーらしさが出ています。
オリジナルデザインで作成した404エラーページはどのように設定すれば、ユーザーに見せることができるのでしょうか?いくつかの手順があるので、メインとなるものを紹介します。
オリジナル404エラーページのファイルを404.htmlという名称で、トップ直下に設置します。そして、.htaccess に以下の記述を追加します。.htaccessは、テキストエディタで記述し、そのファイルを「.txt」から「.htaccess」という名前で保存することで作成することができます。
これで、ステータスコード404を返した時に、404.htmlを表示することができます。
ただし、ここで指定するパスには注意が必要です。記述するパスは、必ず、「/404.html 」という相対パスにしましょう。「http://〜」などから始まる絶対パスで指定をすると、ステータスコードが404(エラー)ではなく、200(正常)になってしまいます。
これは先ほど説明をした「ソフト404」になります。ユーザーにとっては同じ見た目ですが、検索エンジンのクローラーはステータスコードでサイトの状態を判断するため、ユーザーに見せたくないページにも関わらず、検索対象になってしまう可能性があります。
検索エンジンを混乱させる原因となりますので、404ページの設定後は、必ずステータスコードを確認しましょう。
Web上には、各ページのステータスコードを確認できる無料ツールがいくつか公開されています。
例えばこちらの「HTTP Status Code Checker」。
このフォームに、存在しないURLを入力し「submit」ボタンをクリックすると、ステータスコードが表示されます。エラーページがきちんと404になっているかを確認する際に、ぜひ使ってみてください。
レンタルサーバーの管理画面(コントロールパネル)でも、404エラーページの設定が可能です。
今回はお名前.comの共有サーバーの設定方法を例にご説明します。
今回はステータスコード404の設定なので、「404」の項目に対象のURLを入力して、確認して設定完了です。
最近は個人の方だけではなく、企業でもWordPressを使ってサイトを制作している場合が多いと思いますので、WordPressでの設定方法についてもご紹介します。
WordPressでは、404.phpを作成することで、404エラーページの設定が可能です。404.phpはデフォルトのテーマでは含まれていません。ページが存在しない場合や、ページの有効期限が過ぎている場合にはindex.phpを優先的に表示するように設定されています。
404.phpを作成すると、WordPressはページが存在しない場合に、index.phpではなく、404.phpを優先的に表示するようになります。なお、テーマによっては404.phpが含まれているので、デザインや要素が問題ないか確認し、必要に応じて修正しましょう。
Google Search Console(サーチコンソール)では、Googleのクローラーがクロールをした際に検知した404エラーページのURLを確認することができます。
旧Search Consoleでは以下の方法で確認できます。
新Search Consoleでは、以下の方法で確認することができます。
新旧両方のSearch Consoleとも表示されたURLをクリックするとリンク元のURLを確認することができます。
前述の通り、画面上で404エラーの数が多かったり、増えたからといってSEOの順位が下がるということはありません。
GoogleがSearch Console上でエラー内容を表示しているのは、サイトにとって重要なページが意図せずに404エラーになっていないか、 設定ミスはないかというアラートを出す目的があります。
クローラーが辿ったページはユーザーも辿れるページです。ユーザーが不必要な404ページにアクセスしてしまっているかもしれません。リンクしたURLを打ち間違えていたり、リダイレクト設定が誤っているURLがないか等を確認する時に使いましょう。
なお、クロールエラーと表示されたURLを修正して、チェックマークを付け、「修正済みとする」をクリックしても、再度クロールしてくれるなど検索エンジンが何かをすることはありません。あくまで対応したという管理が目的になっていますので注意しましょう。
本当に削除されていて存在しないページが404エラーになっていた場合は、まったく問題はありません。
また、存在しないページがいつまでもクロールすることがありますが、Googleのジョン・ミュラー氏は下記のように回答しています。
古い404ページをグーグルは確かにクロールする――時々だが。
そのこと自体は何も心配しなくていい。
ただし、ページが500番台のエラーを返していたら問題になる。クロールが減るからだ。また、インデックスされるはずのページがGooglebotに404を返しているとしたら、それも問題だ。
That's a very vague question, and a post from 2016, it makes it a bit hard to guess :). We do crawl old 404 pages from time to time, that's nothing to worry about. It's more problematic if they're 5xx errors (we slow crawling), or if the URLs were meant to be indexed.
— 🍌 John 🍌 (@JohnMu) July 9, 2018
GoogleBotは半永久的に一度発見したURLにクロールします。クロールの頻度が減る場合もありますが、404や410となっていても、そのURLで以前のコンテンツ内容が復活していたり、他のコンテンツ内容に変更される可能性があるためクロールしているのです。
つまり、Search Console上でクロールエラーに表示され続けるURLがあっても、404になっていれば全く問題ないのです。
最後に、404エラーページでしてはいけない設定事項を注意しましょう。
テクニカルな話も入りますが、しっかり押さえておきたいポイントです。
避けるべき方法:
- 検索エンジンで 404 ページがインデックスに登録されるようにする(404 HTTP ステータス コードを返すようにウェブサーバーを設定しておきます。JavaScript ベースのサイトの場合は、存在しないページが要求された場合に備えて noindex robots メタタグを含めておきます)。
- robots.txt ファイルを通じて 404 ページがクロールされるのをブロックする。
- 「見つかりません」や「404」などの曖昧なメッセージのみを表示する。または、404 ページが存在しない。
- サイトの他のページと一貫性のないデザインを 404 ページで使用する。
引用:「検索エンジン最適化(SEO)スターター ガイド」より
まず、404エラーページはindex必要なページではありませんので、noindex設定するのがいいでしょう。
404エラーページはSEOに影響はありません。しかし、エラーページを設定したが、実は404のステータスコードではなく200になっている「ソフト404」になっている場合、検索エンジンにindexされたくないページがindexされてしまうことになります。
また、404ページはクロールできるよう設定しておくべきでありrobots.txtでクロールを防ぐ必要はありません。特段の設定をしていなければ問題ありませんが、404ページはクロールできるようにしておくべきと認識しましょう。
後は、既に言及したことですが、サイトのデザインと一貫したデザインを404ページに反映し、404ページを見たときにユーザーが迷わないような文言を設置してあげましょう。
404はHTTPステータスコードの番号の1つです。404のステータスコードがサーバーから返されると、要求された(URL等)情報が存在しなかったことを示します。
サイト運営上、404エラーページが発生するのは自然なことなので、検索順位に悪い影響を及ぼしません。むしろ、ページが削除された時の404のステータスコードを出す方が、検索エンジンにとって望ましいです。
基本的に問題がないことが多いです。ただし404を返したページがサイトにとって重要なページである場合、なぜ404ページになっているかをサイト運営者は確認する必要があります。
デフォルトの404ページは、ユーザーフレンドリーではありません。ユーザーには、ページが存在しないことを伝えた上で、同じようなページを探すヒントを与えるような誘導リンクを付けてあげるとよいでしょう。
404のステータスコードを返すべきページであるにも関わらず、ステータスコード200(成功)が返されている状態をソフト404と呼ばれます。「ファイルが見つからない」状態なのに200ステータスコードを返すと、クローラーを惑わす原因になります。
404エラーページは、SEOへの影響はほとんどなく、ユーザビリティへの影響が非常に高いページです。
その他のページと同様に、404エラーページもユーザーのために、ユーザーの役に立つコンテンツにしましょう。今回ご紹介した情報が、404エラーを適切に設置するためのお役に立てれば幸いです。
なお、SEOにおいて修正すべき重要な項目については、下記にまとめていますので、参考にしてください。
「デザインを変えたい」「更新をもっと楽にしたい」などホームページをリニューアルする理由は様々だと思いますが、折角リニューアルしたからには今ま…
<h1>タグとは、HTMLの1つで、きちんと記述することで人間にも検索エンジンにも、ページの内容を伝えやすくすることができます。…
これからWebマーケティングに取り組もうとしている方の中には何が有効な施策なのかが分からない方も多いのではないのでしょうか?ここではSEO対…
2018年1月18日、Googleのウェブマスター向け公式ブログにて、モバイル検索のランキング要素にページの読み込み速度が組み込まれるSpe…
ウェブサイトと立ち上げる際、ドメインの使い方として、サブディレクトリとサブドメインのどちらにするべきか、迷うことはないでしょうか?ドメインに…
ウェブサイトをリニューアルする際に「古いページから新しいページには301リダイレクト転送してください。」、存在しないページにアクセスされた際…