プログラミング:RGoogleAnalyticsでAPIを使用してサイトヒートマップを構築【研究素材含】

RGAパッケージが主流な今、RGoogleAnalyticsを使う理由がないってのはわかりますが、ちょいと情報が足りな過ぎたので、あえてこっちを使ってみました。海外の質問サイトもみてAPIがらみでトラブルが多発しましたので、逐一解決していきました。ヒートマップをさらに工夫を加えている例があったのでそれに倣って当ページでの分析を進めました。

参考にしたサイトさん:

R GoogleAnalyticsを使う | ウェブディレクターのための統計入門←情報が古いのでGAのAPIがらみで役に立ちませんが、それでもRGA主流の今となっては貴重なサイトです。ここがなければ入り口はつかめなかったでしょう。
RGoogleAnalyticsパッケージの使い方について←APIと認証キーの三点セットはここが役に立ちます。三つキーが必要になるので、それをおさえたうえでここら辺をみていけばRGoogleAnalyticsでも十分今でも使いようがあります。このサイトはエラー頻発してもその場その場で解決できたので、めちゃくちゃ役に立ちました。
ggplot2でお手軽ヒートマップ – google analyticsについて←ここは特殊なヒートマップを作る手法が載っています。ですので最後のプロットでセッションとページビュー両方を時系列二重分析(hour,date)する手法が紹介されています。

というわけでこれらのサイトを見ていけばR初心者の私でも十分構築できました。APIの勉強にもなったので達成感がありました。上記サイトやスタックフロー質問掲示板の投稿には何度も助けられました。この場を借りて感謝申し上げます。

これで完成ですね!さて分析を簡単にしますが、セッションは薄い色になればなるほど少ないです。で、ページビューは円が大きくなれなるほど多いです。すなわち色が薄く、円の大きさが大きく多いところにひとりひとりのページへのアクセス数が多くなり効率の良い集客効果が見込めます=直帰率につながらないという良い傾向になります。逆に色が濃くて大きいところも確かに稼ぎ頭ですが、セッションあたりのページビュー数があまり多くなく、効率よくサイト巡回しているとはいいがたいです。このあたりは色彩の検討が必要だと思われます。

ですがデータが集まっていない現状、これだけでは傾向がつかめず、見通しが立たないので、これから半年間をデータ集計期間にして11月には必ず論文を完成させるつもりです。このマップのいいところはhour date双方時系列から見れること、あとはさらにセッションとページビューも円の配置と大きさ色の濃さで感覚的につかめるところだと思いますね。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA