https://の後に、wwwがついているサイトもあれば、ないサイトもある。うちのサイトはwwwをつけてもつけていなくても、アクセスできる。これってなんか意味あるのかな?
こんな疑問に答えます。
URLの正規化という言葉を聞いたことがあるでしょうか。
ほとんどの方は、ないはず。
私自身、ブログをやっていなければ、気にしないで一生を終えていたかもしれません。
ですが、私のようにブログを始め、Webページを運営している人にとっては、覚えておくべきテクニックです。
本記事では、URLの正規化についてと、その方法について解説します。
URLの正規化とは【重複しているURL例の紹介】
URLの正規化とは、重複しているURLを一つに統一することを意味します。
最初に、重複しているとはどういうことなのか、例を用いて解説します。
次に、重複しているURLを統一すべき理由について、解説します。
重複URL例の紹介
4つほど、重複URLの例を紹介します。
ケース1:wwwあり・なし
- https://mote-log.com
- https://www.mote-log.com
一見同じっぽく見えますが、www
がついており、文字列としては別物です。
しかし、どちらをアクセスしたとしても、https://mote-log.com
にアクセスされます。
https://mote-log.com
にて正規化しているからです。ケース2:SSL化
- https://mote-log.com
- http://mote-log.com
SSL化(冒頭がhttpsとなる)されている場合、上記のようにhttps
でもhttp
でもアクセス可能な状態です。
SSL化以外はほとんど同じ内容のため、重複として扱われます。
ケース3:index.html(php)の有無
- https://mote-log.com
- https://mote-log.com/index.html
- (PHPの場合)https://mote-log.com/index.php
検索エンジン的には、/index.html
や/index.php
の有無で別物と判断します。
ケース4:複数の類似ページ
例えば【商品名X】というガムの商品ページがあったとして、ガムの味だけ商品ページを作成したとします。
売り込み文句はほぼ同じで、パッケージ用の商品写真のみ差し替えられているとします。
この場合、かなり類似されたページ構成になる=重複扱いされることは間違い無いです。
- 商品名X-オレンジ味.html
- 商品名X- イチゴ味.html
- 商品名X- ブドウ味.html
- 商品名X- リンゴ味.html
例えば上記のようなページは、味の記載や写真以外は類似しすぎていることもあり、重複としてみられる可能性が大です。
重複URLの正規化が必要な理由
単純な話なんですが、ざっくりと以下の通り。
- 検索エンジンが混乱する=ペナルティ付与
- ユーザビリティの低下
- アクセス解析の結果が分散される
少し、深掘りします。
検索エンジンが混乱する理由
例えば当ブログ、https://mote-log.com
には、先ほどの例(ケース1・2・3)の通り、複数のアクセス方法があります。
- https://mote-log.com
- https://mote-log.com/index.php
- https://www.mote-log.com
- http://mote-log.com
検索エンジン(Googleなど)はこのような状態を非常に嫌い、ペナルティとして検索エンジンのインデックスを消したり、かなり後ろの方に飛ばしたりすることもあります。
検索エンジンの後ろの方に飛ばされると、運営しているサイトは一気にオワコン化します。
ユーザビリティの低下につながる理由
上記の理由にて検索エンジンが混乱するくらいですので、ユーザー(人間)も混乱します。
心優しい誰かが、当ブログに被リンクをしてくれることになったとして、サイト運営者の私が重複URLを放置したままにしていると、どれを使っていいのか分からなくなりますね。
また、みんな好き勝手に思い思いのURLを使い始めると、統一性がなくなり、
様々な人に混乱を招き、迷惑をかけます。
アクセス解析の結果が分散される理由
重複URLは全てが独立したURLのため、多種多様な方法でアクセスしてくる人たちのデータは、URL毎に分散されます。
それはそれでデータ解析として興味深いのですが、正規化URLに一本化してデータ解析を続けて行った方が圧倒的に楽です。
このような理由で、重複URLは、速やかに正規化をすべきです。
重複URLを正規化する2つの方法【301リダイレクト/canonical】
301リダイレクトをする
当サイトの正規化URLは、https://mote-log.com
です。
よって、
- https://mote-log.com/index.php
- https://www.mote-log.com
- http://mote-log.com
のような、重複URLは全て、301リダイレクトで正規化URLに転送しています。
実際にリダイレクトするには、サーバー(Xserverやmixhost
など)にログインして、htaccessを書き換える必要があります。
301リダイレクトについては、別記事にも記載していますので、併せてお読みください。
301リダイレクトとは【Webページの評価を下げない転送方法】
301リダイレクト(Permanent Redirect)を行うことで、ブログやホームページなどのWebページの評価を下げずに、ページ移転やパーマリンク変更が可能となります。それまでの苦労や手間ひまを無駄にせずに済みますね。高評価なページを移転・変更するときには必ず301リダイレクトをしましょう。
実際の対応策について
http→https
への重複URLの正規化方法は下記の通り。
httpをhttpsにリダイレクトする方法【切り替えは簡単です】
重複URLの代表例、httpとhttpsの混在がある場合のURL正規化・健全化の方法について解説します。方法としてはリダイレクトなのですが、とても簡単なので速やかに設定してしまいましょう。.htaccessにコピペして追記するだけのコードもありますので、ご活用ください。
wwwのあり/なし
に関する重複URLの正規化方法は下記の通り。
【簡単】URLのwwwのあり/なしを統一して重複URLを回避しよう
URLにwwwのあり/なしを統一・正規化しておかないと、重複URL判定を受ける可能性があります。この状態は訪問者や検索エンジン(Googleなど)にとって悪影響です。重複URLを解消する手続きは簡単なので、早急に行いましょう。なお、wwwのあり/なしでサイトの評価が増減するということはないので、安心してください。
index.htmlまたはindex.php
に関する重複URLの正規化方法は下記の通り。
index.htmlやindex.phpをリダイレクトで正規化する方法
index.htmlやindex.phpといった、トップページを示すファイルについては、対策を施さないと重複URLのペナルティを食らうハメになるかもしれません。リダイレクトを適切に行い、URL正規化にてWebページの環境を整えましょう。コピぺOKのコードも紹介します。
紹介した記事をお読みいただければ、さらに理解が進むと思います。
是非、参考にしてみてください。
canonicalタグを利用する
前述のケース4のような場合、代表してオレンジ味を正規化URLとして扱おうと決めたとします。
- 商品名X-オレンジ味.html
- 商品名X- イチゴ味.html
- 商品名X- ブドウ味.html
- 商品名X- リンゴ味.html
この場合、商品名X-オレンジ味.html以外(イチゴ味、ブドウ味、リンゴ味)のheadに
link rel=”canonical”href=”商品名X-オレンジ味.html”
を付与します。
そうすることで、この中では、商品名X-オレンジ味.htmlが正規化URLであることが検索エンジンに通知されます。
重複URLを正規化して、質の高いサイト運営をしよう
これまでの通り、重複URLがあることはデメリットが大きく、長い間放置すべきものではありません。
速やかに対応し、正規化されたURLで自サイトを統一しましょう。
細かい内容かもしれませんが、細かさの積み重ねが、他サイトとの差として、将来響いてきます。
検索エンジンに(特に、Googleに)、ユーザーに愛されるサイトを目指していきましょう。