ソフト404エラーとは、コンテンツが存在しないページにも関わらず、何らかの原因でサーバーが返すステータスコードが404に「なっていない」状態で200を返してしまうエラーです。
通常の404ページとは違ってなかなか気づきにくいエラーです。SEOにほとんど影響を与えないとされますが、サイトの重大なバグの兆候になることもあります。
そこで今回は、ソフト404がSEOに与える影響や、ソフト404の調査方法などについてご紹介します。
目次
ソフト404エラーとは、コンテンツが存在しないページにも関わらず、何らかの原因でサーバーが返すステータスコードが404に「なっていない」状態です。
ソフト404の場合でも下記のように通常のエラーページが表示されます。
しかし、ステータスコードをチェックすると404ではなく、200とリクエストが正しく承認された内容が返信されます。つまり、存在しないページが検索エンジンからは存在していると認識されているのです。
本来コンテンツが存在しないページは404のステータスコードを返すべきです。クローラーはサーバーが返すステータスコードを信用して、そのページにコンテンツがあるかどうかを判断します。
しかし、実質的にコンテンツが存在しないのに、ステータスコード上はコンテンツがあるかのように見えているため、検索エンジンはソフト404ページに対してどのように処理をすればいいのか戸惑ってしまいます。
ソフト404ページはブラウザでサイトを閲覧しているユーザーに対してあまり実害はありませんが、Googleなどの検索エンジンのクローラーを惑わせてしまう原因となってしまいます。SEOにはあまり悪影響を与えないため放置されがちなエラーです。
しかし、存在しないページのクロールすることになり、存在している重要なページのクロールが遅くなったり、頻度を下げることになりますので、サイトへ悪影響が出る可能性もありますので注意する必要があります。
通常の404エラーとの違いをまとめておきましょう。
ソフト404 | 通常の404 | |
---|---|---|
コンテンツ | 存在しない | 存在しない |
ステータスコード | 200など | 400 |
コンテンツが存在しない点はどちらも同じですが、返すステータスコードを間違えてしまっているのがソフト404エラーとなります。
通常の404についてはこちらの記事を参考にしてください。
ソフト404エラーが発生する原因はさまざまです。
データベースと連動してページを自動的に生成するタイプのサイトでは、プログラムの設定ミスでソフト404エラーが起こりがちです。
ECサイトを例にあげてみましょう。ECサイトでは以下のようなURLで商品ページを生成することが多いです。
例えば商品IDが1の場合は以下のようになります。
もし存在しない商品IDである20にアクセスするとどうなるでしょうか?URLはこのようになります。
商品IDが20のページは存在しないため、ユーザーに対して「その商品ページは存在しません」などと表示する場合が多いです。
実質的に404だからといって以下のようにブラウザ標準の404ページを表示してしまうと、ユーザーに対して不親切だからです。
ソフト404ページは、この「親切心」が仇(アダ)になって起こってしまいがちです。
存在しない商品ページは実質的に404なので、ステータスコードも404を返さなければいけません。ECサイト構築時に404を返す仕組みを自前で作っておかなければいけませんが、プログラムの設定ミスや設定漏れなどでステータスコード200を返してしまいがちです。
このような原因で「実質的には404なのに、ステータスコードは200を返してしまう」というソフト404エラーが起こってしまうのです。
.htaccessの記述ミスでもソフト404は起こります。
正しくステータスコード404を返す記述が下記になります。
しかし、誤って下記のように絶対パスを記述するとリダイレクトされてしまい404を返さなくなってしまいます。
.htaccessのErrorDocumentを使って404時に任意のエラーページを表示させたい場合は、相対パスを使わなければいけません。誤例のように絶対パスを記述するとリダイレクトされてしまい、404を返しません。
先ほどのご説明しましたが、ソフト404エラーはSEOにほとんど悪影響はありません。
その根拠としてGoogleのジョン・ミューラー氏の発言があげられます。GoogleのSearch Consoleにソフト404エラーのレポート機能が追加された2010年当時の公式フォーラムで、以下のように述べています。
(ユーザーの「ソフト404エラーはSEO上ペナルティの対象か?」という質問に対し)
- ソフト404エラーでペナルティは与えない
- ただしクローラーの効率が悪くなる
- できれば無くしてほしいが、致命的なエラーではないので焦る必要はない
このように答えていることから、SEOにおいて悪影響はほとんど無いと考えられます。
だからといってソフト404エラーを放置していいわけではありません。
Googleのジョン・ミューラー氏「クローラーの効率が悪くなる」という発言をもう少し具体的に噛み砕いてみましょう。
- ソフト404エラーのせいで、クローラーの効率は悪くなる
- 新規コンテンツや既存ページの更新をGoogleが認識しづらくなる
人間が画面を見れば明らかにコンテンツが存在しないとわかるソフト404ページですが、Googleのような検索エンジンクローラーはどのように処理をすればいいのか迷ってしまいがちです。
そのため、サイト全体のクロール効率が落ち、新規コンテンツや更新ページのインデックス反映などが遅くなってしまうとジョン・ミューラー氏は述べているのです。これが原因でサイトの検索順位に何らかのマイナスの影響を与えてしまう可能性は、ゼロではありません。
まとめると以下のようになります。
SEO上はあまり悪影響がないとされるソフト404エラーですが、重大なバグの兆候となっていることがあるので注意が必要です。
コンテンツが存在しないページに対し、プログラムがステータスコード200を返してしまっているということは、逆の可能性もありえます。つまり、「コンテンツが存在するにも関わらず、ステータスコード404を返してしまっている」という状態です。
これは重大なバグであり、SEOにも大きな悪影響を与える可能性が高いです。
もっともありがちなケースとして、プログラムの改修時にステータスコードの404と200を逆にプログラミングしてしまう場合があげられます。
例えば、改修前は問題なく下記のように入力していたとします。
コンテンツが存在するページ | ステータスコードが200 |
---|---|
コンテンツが存在しないページ | ステータスコードが404 |
しかし、改修後に記述ミスで逆になってしまうケースがあります。
コンテンツが存在するページ | ステータスコードが404 |
---|---|
コンテンツが存在しないページ | ステータスコードが200 |
もしソフト404エラーが急増している場合は、上記のようにコンテンツが存在するページに404を返してしまっているという最悪のケースも想定されるので注意してください。
ソフト404エラーを防ぐにはどうすればいいでしょうか?
この2ステップでソフト404エラーは完全に無くすことができます。まずはソフト404エラーが発生していることを検知しましょう。
GoogleのSearch Consoleを使いましょう。
ソフト404エラーはブラウザではなかなか気づきづらいです。常にブラウザ上でステータスコードを表示している設定にしていても、なかなか目視では気づきにくいものです。
Googleが提供しているSearch Console(旧ウェブマスターツール)ではクローラーが遭遇したさまざまなエラーをレポートしてくれる機能があり、その中にソフト404エラーも含まれています。
Search Consoleには現在新しいバージョンと古いバージョンが存在しますので、それぞれのソフト404エラーの報告画面を確認しておきましょう。
新しいバージョンSearch Consoleでは、インデックス、対象範囲、除外の順番でクリックすると下記のような画面が表示されます。
一方で、以前のバージョンSearch Consoleでは、クロール、クロールエラー、URL エラーの順番でクリックすると下記のような画面が表示されます。
これでクローラーが遭遇したソフト404、通常の404などのエラーレポートを確認することができます。新しいバージョンのSearch Consoleレポートでは以下のような文言が表示されます。
ソフト404 | ソフト404エラー |
---|---|
通常の404 | 見つかりませんでした(404) |
Search Consoleにはサイト全体で検出されたソフト404ページが全て記録されており、最新の検出された日時も確認できます。
どのページがソフト404になっているのかSearch Consoleで確認できたら、次は原因を探りましょう。多くの場合はプログラム上のミスによって、本来ステータスコード404を返すべきところで200を返してしまっています。
その他にもApache/Nginxなどのサーバーソフトの設定ミスや、.htaccessの記述ミスなどの原因が考えられます。WordPressなどでソフト404エラーが出ている場合は、WordPressの本体よりもプラグインによるバグなどの可能性があります。
考えられる原因を丁寧に1つずつ潰し、削除していくようにしてください。
削除されたページやそもそも存在しないページ、URLのつづりが間違っている時など、表示したページのリクエストが正しく処理できない状態のことを指します。
本来404のステータスコードを返すべきなのに、200のステータスコードが返されているときに発生します。
検索エンジンのクローラーを惑わせてしまい、存在しているページにおけるクローラーのサイト巡回やインデックスに影響を及ぼしてしまいます。
新規・更新ページにおけるクローラーの効率が悪くなるため、間接的にサイトの検索順位が落ちてしまう原因になる可能性があります。
たまに記述ミスでコンテンツが存在するページに404を返してしまっているケースもあるため、注意が必要です。
「ソフト404エラー」について解説してきました。
最後に重要な点をまとめておきましょう。
ソフト404はそこまで重大なエラーではありませんので、もしGoogleのSearch Consoleのエラーレポートで報告されていても、対処する優先度は低くなります。
しかし、ソフト404はサイト上の重大なバグの兆候となっていることはあります。もしエラーが確認されたら社内のエンジニア等に報告し、必ず原因を探るようにしましょう。
ディーエムソリューションズのSEOコンサルタント、犬塚と申します。 過去には、「SEOコンサルタントがこっそり教えるSEO施策のコツ」など、…
私たちがSEO事業をスタートした2006年のSEO施策は、現在の施策とは大きく異なるものでした。 人工的な外部リンクが隆盛を極め、とにかくリ…
皆さんはSEOを外注ではなく、自分で実施したいと考えたことはありませんか? 外部リンクによるSEOが終焉に近づき、コンテンツによるSEOが全…
みなさんはSEOにはブラックハットSEOとホワイトハットSEOと呼ばれる2つのアプローチがあることをご存知でしょうか?今回の記事ではブラック…
「WEBサイトの流入が増えない」「狙っているキーワードでの検索順位がなかなか上がらない」といったSEOに関する悩みを抱えているが、「原因が何…
日々進化し続けるGoogleのアルゴリズムに対し、最適化を図るSEO(Search Engine Optimization)もこれまでにいく…
今話題のAIによるコンテンツ自動生成機能も!SEO対策に本当に必要な機能だけを搭載した使いやすさとコストパフォーマンスに優れたWeb集客支援ツールです。
Webマーケティングに関わる施策全般をワンストップで
ご提供します。
お気軽にご相談ください。
Webマーケティング最新ニュースのレポートや無料セミナーの先行案内が届く、お得なメルマガ配信中!