アクセス解析のデータを狂わすリファラスパムとは?

Googleアナリティクスなどのアクセス解析のデータを見ると、GoogleやYahooなどの検索サイトでどのような語句で検索して訪問してくれたのか、どのサイトのリンクをクリックして訪問してくれたのかを知ることができる。
このリンク元のことを「リファラ」または「参照サイト」などと呼ぶ。

この参照サイトを見るにはGoogleアナリティクスの場合、左メニューの「集客」から「参照サイト」を選択する。
参照サイトを選択

で、右側の画面をスクロールして少し下に行くと、以下のように参照サイトのURLがわかる。
参照URL

初期設定では10件ずつの表示になっていて、それ以降を見たい場合はページ送りをする必要があって少し面倒である。
ですから、表の右下のほうにあるプルダウンメニューから表示件数を変更すると良いでしょう。
表示件数の変更

そして一覧表を見ていきます。
この一覧は初期状態ではセッション数のランキングになっています。(※セッションというのはブラウザを閉じるまでが1セッションです)
セッション数での一覧

リファラスパムとは

ここからが重要です。

世界中の多くのサイトでGoogleアナリティクスなどのアクセス解析が設置してあります。
例えば、上記の参照サイト一覧の中に自分が宣伝したいURLを載せておくことができれば、アクセス解析を見たそのサイトの管理者は「どんなサイトなのかな?」とクリックしてみるかもしれません。

そうなることを目的とし、自動で巡回するプログラムなどによって実際にはアクセスしていないサイトのアクセス解析にURLを残す手法を「リファラスパム」といいます。

例えて言うと、アメブロのコメント欄に、

「ブログ拝見しました。
素敵なブログですね。
私もブログを始めたので、良かったら見に来てください。」

と、自分のブログへアクセスさせるため、実際には1行も読んでいない他人のブログにコピペで残すのと似ている。(アメブロの場合、書き込んだ際の名前が自分のブログへのリンクになる)
リファラスパムとは、これをプログラムで自動的に行っているようなものである。

迷惑メールのことをスパムメールと呼んだりするように、このリファラスパムもただの迷惑行為でしかありません。
実際にはそのサイトにアクセスして閲覧していないのですから。
ですから、このようなアクセスは解析結果のデータから除外しなければ正確なデータがわかりません。

なに?アクセス数が多くなって都合がいいじゃないか。だと?

それは間違っています。
その発想は、アメブロの水増しされたアクセス数を見て喜んでいるのと同じです。
参考ページ:アメブロのアクセス解析の水増しの考察その1

アクセス解析を設置する本来の目的とは

アクセス解析のデータ
アクセス解析を設置する目的とは、ただアクセス数を計測するだけではなく、

  • どのような検索語句で自分のサイトに来てくれたのか?
  • どのサイトのリンクから来てくれたのか?
  • 自分のサイトのどのページを見てくれたのか?
  • 合計何ページ見てくれたのか?
  • どのページで離脱してしまったか?

などを知ることで、サイト改善に役立てるためにあるのです。
それによってアクセス数を増やし、お問い合わせや成約率などを高めるのが本来の目的です。

ですから、実際にはサイトを閲覧していないリファラスパムのアクセスは除外しなければいけないのです。

リファラスパムを除外するやり方についてはまた次の機会に。