canonical属性値の使い方や重複ページの問題点
- 公開日 : 2015年12月2日
- カテゴリ : Web制作
まったく同じ内容のページ、つまりコピーした内容のページ(重複ページ)というものは検索順位が下げられます。
つまり、SEO面でマイナス評価・ペナルティになる。
Webの素人の人の感覚からすると「たくさんページが存在すれば、どれかがヒットするかもしれない」というような気持ちでコピーした同じ内容のページを量産することがあるが、このようなことをすると逆にペナルティを食らってそのドメインの評価が下げられることになってしまいます。
ドメインの評価が下げられるとそのドメインに属するすべてのページの検索順位が連動して下がるので、損失としては非常に大きい。
しかし、何らかの理由によって同じ内容のページが存在することを避けられない場合、canonical属性値を正しく設定することでSEO面でのマイナス評価を避けることができます。
今回は重複ページがなぜ問題になるのかや、canonical属性値の設定の正しい使い方について解説します。
重複した内容のページはなぜペナルティの対象になるのか?
まずは、なぜ同じ内容のページが複数あることが問題になるのかを知る必要があります。
この答えはあなたが検索をする立場になってみれば簡単にわかります。
もしあなたが何らかの情報を知りたくて検索をした時に、同じ内容のページばかりが検索結果の1位から10位まで表示されたとしたらどう思うでしょうか?
とても迷惑に感じると思います。
さらに、そのような結果を出すような検索エンジンに対して「使いにくい検索サイトだな」と感じることでしょう。
GoogleやYahooのような検索サイト側にとって、ユーザーにそのように思われるのは困るわけです。
より多くの人に利用してもらえなければ、企業としての利益も減ってしまうからです。
重複した内容のページが引き起こす問題点
上記のような理由から、まったく同じ内容が書かれているページが複数存在すると、Googleからはコピー(パクリ)サイトとみなされて検索順位が下げられることになります。
しかし、ここで次の問題点が発生します。
例えば、自分のサイトの内容を他人に無断でコピーされた場合、そのコピー(パクリ)サイトが自分のサイト(オリジナル)よりも良い検索順位で出ては困るのは当然である。
だからその場合にコピー(パクリ)サイトの検索順位を落とすのは至極当然の処置だと言えます。
しかしここで問題になるのは、
Google側がどちらのサイトをオリジナルとみなすかわからない。
という点である。
もしかしたらコピー(パクリ)サイトのほうをオリジナルとみなし、自分のサイト(オリジナル)のほうの順位が下げられることになるかもしれない。
よくありそうな一つの例として、
自社サイト内(独自ドメイン)でブログを書いていて、それと同じ内容をアメブロでも投稿している。(アメブロ内の友達登録での集客のため)
というような場合、自社サイト内のページよりもアメブロのページのほうが検索上位に表示される可能性がある。(ameblo.jpのほうがドメインパワー(評価)が強いため)
それどころか、自社サイトがパクリサイトの扱いを受けてドメイン評価が下がれば、自社サイトの全てのページの検索順位が下がる。
最近のGoogleのアルゴリズムはとても優秀なので、コピーかオリジナルかの判別精度は非常に高くなってきています。
しかし、それでも100%ではありません。
万が一、オリジナルのサイトのほうがコピー(パクリ)とみなされ、そのページだけでなくドメインごとペナルティを食らったりしたら大変なことです。
それを回避するためにcanonical属性値を正しく記述する必要性があるわけです。
canonical属性値の正しい書き方
canonical属性値はhead要素内に以下のように書きます。
CSSへのリンクやmetaタグと並べて記述することになります。
body要素内に書かれている場合は無視されます。
<link rel="canonical" href="オリジナルページのURL" />
ちなみに、canonicalは日本語で「正典の」という意味です。(canonicalの意味 – 英和辞典 Weblio辞書)
このコードによってオリジナルのページを示しているわけですね。
逆に言えば、このコードが書かれているページは「ここはオリジナルではない」と認めていることになり、検索結果に表示されるページにはオリジナルのほうが優先されることになります。
他人に無断でパクられた場合はDMCA(デジタルミレニアム著作権法)に基づいて申請する
つまり、他人に無断で内容をパクられたようなケースではlink rel=”canonical”の手法は使えないことになります。
他人のサイトに上記コードを書き込むことはできないですからね。
この手法が使えるのはあくまでも「自分の管理下にあるサイトで重複した内容のページがある場合」に限られます。
もし他人に無断で内容をパクられたような場合はDMCA(デジタルミレニアム著作権法)に基づいてGoogleに申請をすることで、パクリサイトを検索結果から削除することができます。(これをインデックス削除と呼ぶ)