Googleアナリティクスでリファラスパムをまとめて除外する方法

グラフ
Googleアナリティクスを見ていると、毎月のように新たなリファラスパムが来る。
リファラスパムに関してはこのブログでも何度か書いたことがある。

  1. アクセス解析のデータを狂わすリファラスパムとは?
  2. リファラスパムを判別し、Googleアナリティクスから除外するやり方

上記ページで解説したやり方は「新たなリファラスパムが発見されたら、それを除外設定する」という手法である。
しかし、毎月・毎週のように新たなリファラスパムが現れ、その度に一つ一つ除外設定をするのはいい加減面倒になってきた。

このブログのGoogleアナリティクスのフィルタ設定などはすでに以下のようになっていて、この先もこれが続くとなるとキリがない。
Googleアナリティクスの除外設定
この先もこんなことはやってられないので、今後の作業を軽減できるように一括で除外してしまうことにする。

リファラスパムの共通点

以下の画像はこのブログの2015年5月のリンク元一覧である。(リファラスパム以外はモザイクをかけています)
リンク元一覧

このように言語設定を表示させると、リファラスパムはenまたはen-us、または(not set)の言語設定になっている点が共通している。
リファラスパムの言語設定
つまり、言語設定によってフィルタをかけてしまえば一発である。

ちなみに、「ブラウザの種類」や「画面の解像度」などでもリファラスパムは(not set)のものが多いですが、(not set)じゃないリファラスパムもあったので、「ブラウザの種類」や「画面の解像度」で一括除外はできないと思います。

あと、英語のサイトを運用している場合は言語設定がen(英語)のアクセスが多くなると思うので、今回のやり方はしないほうが良いでしょう。
私のこのブログは言語設定がen(英語)のアクセスはリファラスパムぐらいしかないので、そこを利用して一括除外してしまうというわけです。

まとめて除外する方法

まず、アナリティクス設定の中の「すべてのフィルタ」を選択する。
アナリティクスのフィルタ設定

次に、「フィルタを追加」のボタンを押す。
フィルタを追加

次は以下のように設定するので、まずは設定完了図から見ていただこう。
除外設定
フィルタ名」はフィルタ一覧に表示されることになるので、自分がわかりやすい名前を付けておく。

「フィルタの種類」を「カスタム」に切り替え、「除外」のラジオボタンにチェックが入っていることを確認してから、「フィルタフィールド」のプルダウンメニューから「言語設定」を選択する。

「フィルタパターン」はnot setと半角で入力する。(間のスペースも半角)

これらの設定が完了したら、ページ下にある「保存」のボタンを押せば完了である。
この設定によって言語設定がnot setのアクセスは解析結果から除外されます。

同じように言語設定がenのものも設定しておけば、enとen-usのアクセスもまとめて除外できます。
後日追記:どうも上記の設定をしてもen-usが通り抜けてくるので、正規表現を使用して^enと記入しておくほうが良いかもしれません。
英語のアクセスも除外

この作業によって、今後もし言語設定がenまたはnot setのリファラスパムが新たに現れたとしても、除外の設定をする必要はなくなります。