Written by Shoji

Shoji

重複URLを正規化して統一する理由と方法【ペナルティを回避】

SEO

PCを触る人

違いに気づいた人「https://の後に、wwwがついているサイトもあれば、ないサイトもある。うちのサイトはwwwをつけてもつけていなくても、アクセスできる。これってなんか意味あるのかな?」

こんな疑問に答えます。

URLの正規化という言葉を聞いたことがあるでしょうか。
ほとんどの方は、ないはず。

Webページの運営者でもなければ、こだわる人がいないと思います。

私自身、ブログをやっていなければ、気にしないで一生を終えていたかもしれません。

ですが、私のようにブログを始め、Webページを運営している人にとっては、覚えておくべきテクニックです。

本記事では、URLの正規化についてと、その方法について解説します。

URLの正規化とは【重複しているURL例の紹介】

ネットワーク

URLの正規化とは、重複しているURLを一つに統一することを意味します。

最初に、重複しているとはどういうことなのか、例を用いて解説します。
次に、重複しているURLを統一すべき理由について、解説します。

重複URL例の紹介

4つほど、重複URLの例を紹介します。

ケース1:wwwあり・なし

  • https://mote-log.com
  • https://www.mote-log.com

一見同じっぽく見えますが、wwwがついており、文字列としては別物です。
しかし、どちらをアクセスしたとしても、https://mote-log.comにアクセスされます。

これは、当ブログがhttps://mote-log.comにて正規化しているからです。

ケース2:SSL化

  • https://mote-log.com
  • http://mote-log.com

SSL化(冒頭がhttpsとなる)されている場合、上記のようにhttpsでもhttpでもアクセス可能な状態です。
SSL化以外はほとんど同じ内容のため、重複として扱われます。

当ブログではこちらも正規化済みでして、重複を回避しています。

ケース3:index.html(php)の有無

  • https://mote-log.com
  • https://mote-log.com/index.html
  • (PHPの場合)https://mote-log.com/index.php

検索エンジン的には、/index.html/index.phpの有無で別物と判断します。

当ブログでは当然こちらも正規化済みです。

ケース4:複数の類似ページ

例えば【商品名X】というガムの商品ページがあったとして、ガムの味だけ商品ページを作成したとします。

売り込み文句はほぼ同じで、パッケージ用の商品写真のみ差し替えられているとします。
この場合、かなり類似されたページ構成になる=重複扱いされることは間違い無いです。

  • 商品名X-オレンジ味.html
  • 商品名X- イチゴ味.html
  • 商品名X- ブドウ味.html
  • 商品名X- リンゴ味.html

例えば上記のようなページは、味の記載や写真以外は類似しすぎていることもあり、重複としてみられる可能性が大です。

当ブログでは重複記事はありませんが、今後も重複とならないような記事づくりを心がける必要があると感じています。

重複URLの正規化が必要な理由

単純な話なんですが、ざっくりと以下の通り。

  • 検索エンジンが混乱する=ペナルティ付与
  • ユーザビリティの低下
  • アクセス解析の結果が分散される

少し、深掘りします。

検索エンジンが混乱する理由

例えば当ブログ、https://mote-log.comには、先ほどの例(ケース1・2・3)の通り、複数のアクセス方法があります。

  • https://mote-log.com
  • https://mote-log.com/index.php
  • https://www.mote-log.com
  • http://mote-log.com
正規化を行っていないと、どれを本物(メイン)のURLとして定めているのか不安定なままです。

検索エンジン(Googleなど)はこのような状態を非常に嫌い、ペナルティとして検索エンジンのインデックスを消したり、かなり後ろの方に飛ばしたりすることもあります。

検索エンジンの後ろの方に飛ばされると、運営しているサイトは一気にオワコン化します。

ユーザビリティの低下につながる理由

上記の理由にて検索エンジンが混乱するくらいですので、ユーザー(人間)も混乱します。

心優しい誰かが、当ブログに被リンクをしてくれることになったとして、サイト運営者の私が重複URLを放置したままにしていると、どれを使っていいのか分からなくなりますね。

また、みんな好き勝手に思い思いのURLを使い始めると、統一性がなくなり、
様々な人に混乱を招き、迷惑をかけます。

アクセス解析の結果が分散される理由

重複URLは全てが独立したURLのため、多種多様な方法でアクセスしてくる人たちのデータは、URL毎に分散されます。

それはそれでデータ解析として興味深いのですが、正規化URLに一本化してデータ解析を続けて行った方が圧倒的に楽です。

このような理由で、重複URLは、速やかに正規化をすべきです。

重複URLを正規化する2つの方法【301リダイレクト/canonical】

机に向かってプログラミングをしている人
ここでは、重複URLを正規化する方法について解説します。

301リダイレクトをする

当サイトの正規化URLは、https://mote-log.comです。

よって、

  • https://mote-log.com/index.php
  • https://www.mote-log.com
  • http://mote-log.com

のような、重複URLは全て、301リダイレクトで正規化URLに転送しています。

301リダイレクトとは、恒久的/永久的に転送を行う命令であり、解除しない限り永久に効果アリです。

実際にリダイレクトするには、サーバー(Xservermixhostなど)にログインして、htaccessを書き換える必要があります。

301リダイレクトについては、別記事にも記載していますので、併せてお読みください。

実際の対応策について

http→httpsへの重複URLの正規化方法は下記の通り。

wwwのあり/なしに関する重複URLの正規化方法は下記の通り。

index.htmlまたはindex.phpに関する重複URLの正規化方法は下記の通り。

紹介した記事をお読みいただければ、さらに理解が進むと思います。
是非、参考にしてみてください。

canonicalタグを利用する

前述のケース4のような場合、代表してオレンジ味を正規化URLとして扱おうと決めたとします。

  • 商品名X-オレンジ味.html
  • 商品名X- イチゴ味.html
  • 商品名X- ブドウ味.html
  • 商品名X- リンゴ味.html

この場合、商品名X-オレンジ味.html以外(イチゴ味、ブドウ味、リンゴ味)のheadに


link rel=”canonical”href=”商品名X-オレンジ味.html”

を付与します。

そうすることで、この中では、商品名X-オレンジ味.htmlが正規化URLであることが検索エンジンに通知されます。

重複URLを正規化して、質の高いサイト運営をしよう

これまでの通り、重複URLがあることはデメリットが大きく、長い間放置すべきものではありません。
速やかに対応し、正規化されたURLで自サイトを統一しましょう。

細かい内容かもしれませんが、細かさの積み重ねが、他サイトとの差として、将来響いてきます。

検索エンジンに(特に、Googleに)、ユーザーに愛されるサイトを目指していきましょう。