【Google Analytics】not setが異常に増えたので調べてみた

どうもゴエです。

ブログをやる上で、どんな人がこのブログを読んでるのか、どこからアクセスされたのかを確認するために「google Analyst」と言ったアクセス解析を入れてるんですが、今日はそのアクセス解析で起こった事をメモメモ。

事の発端

事の発端は今年(2015年)の3月の末、最近ちょっと放置気味だったので久々に Google Analystにアクセスしたら、2日間ぐらい急にアクセス率が増えてた。

それに伴い「言語」の所に「(not set)」ってワードが出て、セッション数も増えてた。

notset

しかもnot setの直帰率(すぐ帰る率)が100%って・・・・・と言うか、

not setってなんぞ!? って事で調べて見た。

調べてみた

「not set」と「not provided」について

まず、「not set」について調べてみた。 Googleとかで検索すると結構出てきたw

どうやら「not set」と「not provided」がよく見かけるらしい。 この2つのワードは、ざっくり言うとAnalystで解析できなかったというらしいです。

○ not providedは「https~」と言ったセキュリティ保護の関係でGoogleが教えられないキーワードを指しているらしいです。

最近GoogleさんがGoogleアカウントでログインしているユーザーの場合、Googleのトップページを「https」にするのでセキュリティ保護の為、教えられない!ってなるらしいです。

○ not setはnot providedと違い、Googleがうまくキーワードと言った情報が取れなかった場合に発生するらしいです。 広告とかをつけてる場合に起きたりするらしいのですが、今現在広告も貼って無いのでどうやらそれが原因では無いみたいです。

not setを調べたらスパムが原因だった

広告をつけてるわけでも無いのでnot setの原因は別の所にあるみたいなので引き続き調査。

調べて見た結果、どうやら参照先を調べると何かしらわかるらしいので、早速調査。

google Analystの「左メニュー」→「行動」→「サイトコンテンツ」→「すべてのページ」を開くと実際にアクセスされたページが一覧として表示される。 そのページの「プライマリ ディメンション」の「その他」を「集客」→「参照先」にすると実際の参照先が表示された。 参照元

参照先を見てみたら「Google」、「Yahoo」、「direct(直接入力)」、「Twitter」の他に何やら怪しいURLをハッケーン! スパム

その怪しいURLをアクセスするのは危ないのでドメインだけで検索したらこんな記事が・・・・・

thumbnail

Googleアナリティクス リファラースパムやボットのフィルタリング設定

Googleアナリティクスのリファラースパムやボットをフィルタリングでアクセス除外する方法をご紹介します。リファラースパムとは、Googleアナリティクスのトラッキングコードを勝手に引用して、架空のセッション数を計上するという悪質なスパム行為です。

どうやら、最近出回ってる新手のスパム「リファラースパム」らしい

リファラースパムってなんぞ?

リファラースパムはどうやら最近出回ってる新手のスパムらしい。 Google Analysesを使う為に必要なコードを取ってきて、無造作にアクセスをかけてるらしい。 んで、アクセス先のURLだけ残してそれのURLをアクセスすると有害サイトに飛んだり、ウィルスに感染させたりするらしい。

しかも、特にサイトを見るわけでも無いので直帰率が100%とかになるし、実際のアクセス率が正確に取れなかったりと結構めんどい奴。

対策

ともかくこのスパムを何とかしないと正確なアクセスが出ないので対策することに

Analyticsの対策

まずはAnalyticsの方を対策する。 以下のサイトを参考にしてAnalyticsでフィルターの設定をする

thumbnail

Googleアナリティクスでリファラスパム「simple-share-buttons.com」をフィルタする方法

「simple-share-buttons.com」のリファラスパムがGoogleアナリティクスに記録されておりましたので、フィルタ設定をして教示しないようにしてみましたので、備忘録としてポストします。

「アナリティクス設定」→「フィルタ」を選択。 「新しいフィルタ」を選択して「フィルタの種類:カスタム」、「除外」んでパターンを「not set」にして保存。 これで、今後はnot setが出てこなくなるみたい。 この調子で今回出てきたURLもフィルタでブロックw

サーバーの設定

Analyticsの設定は行ったけど、実際はサーバーにアクセスをかけまくってる訳なので、 .htaccessを使ってアクセス設定も行う。 記事によってはあまり効果が無いって言ってるけど、気休め程度にw。 設定方法は.htaccessに以下のように記述する。

#Referer spam list SetEnvIfNoCase Referer アクセス拒否するドメインもしくはIP spammer=yes

Order allow,deny Allow from all Deny from env=spammer

#Referer spam list

「Get-Free-Traffic-Now」の除外設定

フィルタの設定をして大分リファラスパムの数が減ってきたけど、 「www.Get-Free-Traffic-Now.com」だけが中々消えない。 他の同じようにフィルタの設定をしてるんだけどなーっと思ってググって見たら 以下の記事を発見。

どうやら、このリファラスパムは他の奴とは違って別の設定がいるみたいだ。

ということで先ほどのサイトを参考に「フィルタフィールド」を「ブラウザ」にして、 「フィルタパターン」で「not set」って記述してしばらく様子を見ようっと。 ※2015/05/20 追加

2016年のはじめぐらいからまた新しいリファラスパムが出てきた。 「с.новым.годом.рф」って奴。 こいつも他の設定と同様「годом.рф」でフィルタをかければ行けるみたい。 ※2016/02/29 追加

まとまってないまとめ

Analyticsと言ったSEO周りがまだ良くわかってないので今回の問題を特定にするのにすげぇ苦労したw あと、.htaccessとかフィルタをしてもどうやら別のドメインとかでアタックかけたりするらしいので、 すごいイタチごっこになりそう (´・ω・`;) 今後も引き続き監視が必要かなぁ・・・・・

できる逆引き Googleアナリティクス Web解析の現場で使える実践ワザ240 ユニバーサルアナリティクス&Googleタグマネージャ対応 amazon.co.jp
Licensed under CC BY-NC-SA 4.0
Hugo で構築されています。
テーマ StackJimmy によって設計されています。