Google アナリティクスの情報をPythonで取得する(gdata-python)
Webサイトのアクセス数監視に便利なGoogle Analytics。定期的にアナリティクスで集計されたアクセス数などを監視したい。
毎回Webブラウザで確認するのは面倒なので、Pythonで自動化できないか調べてみました。
Google Data APIs Python Client Library
調べてみると、いくつかライブラリがあるようですが、
Google Analyticsで集計した人気ページランキングをPythonから取得してみよう
こちらで紹介されているgdataというライブラリがお手軽そうでした。
Google Data APIs Python Client Library
これを使ってみることにします。
gdata-python-clientのインストール
Ubuntu 14.04にeasy_installでインストールしました。
$ sudo easy_install gdata
バージョン2.0.18がインストールされました。
サンプルプログラム
例として、このブログの2014年6月1日から2014年6月30日の情報を取得してみます。
アナリティクスでの表示は以下のとおりでした。
項目 | 値 |
セッション | 95,380 |
ユーザー | 72,350 |
ページビュー数 | 127,626 |
ページ/セッション | 1.34 |
平均セッション時間 | 00:01:29 |
直帰率 | 81.82% |
新規セッション率 | 61.75% |
いきなりですが、サンプルはこうなりました。
- # -*- coding:utf-8 -*-
- import gdata.analytics.client
- # ログイン情報
- # 普段Googleアナリティクスにログインするのに
- # 使用しているメールアドレス、パスワード
- email = "[email protected]"
- password = "P@ssw0rd"
- SOURCE = 'GData sample client-v2'
- client = gdata.analytics.client.AnalyticsClient(source=SOURCE)
- client.client_login(email, password, source=SOURCE, service=client.auth_service)
- # 取得したい情報をmetricsにカンマ区切りで指定
- metrics = 'ga:sessions' # セッション
- metrics += ',ga:users' # ユーザー
- metrics += ',ga:pageviews' # ページビュー数
- metrics += ',ga:pageviewsPerSession' # ページ/セッション
- metrics += ',ga:avgSessionDuration' # 平均セッション時間
- metrics += ',ga:bounceRate' # 直帰率
- metrics += ',ga:percentNewSessions' # 新規セッション率
- data_query = gdata.analytics.client.DataFeedQuery({
- 'ids':'ga:19407786', # テーブルID
- 'start-date': '2014-06-01', # 集計期間開始
- 'end-date': '2014-06-30', # 集計期間終了
- 'metrics': metrics
- })
- # データを取得し、内容を表示
- feed = client.GetDataFeed(data_query)
- for entry in feed.entry:
- for item in entry.metric:
- print item.name, item.value
実行してみると、ちゃんと狙った値が取得できているようです。
※平均セッション時間の単位は秒
$ python sample.py
ga:sessions 95380
ga:users 72350
ga:pageviews 127626
ga:pageviewsPerSession 1.3380792618997694
ga:avgSessionDuration 89.14410777940869
ga:bounceRate 81.81799119312225
ga:percentNewSessions 61.745648983015315
これからは簡単にプログラムの解説を。
テーブルIDとは
まずわからなかったのが、データ取得時に指定する
「ids(テーブルID)」
これ、何を指定すればよいかというと、Google アナリティクスの画面上部
「アナリティクス設定」 をクリック。
[ビュー] - [ビュー設定]をクリックします。
「レポートビュー設定」で表示される「ビューID」を指定すればOK。
metricsに指定するga:xxxって何
metricsに何を指定すればいいのかがわからない。
私は、こちらのサイトの「metrics」に表示される内容を参考にしました。
Google Analytics Query Explorer 2
とりあえず、現在わかった値は以下のとおりです。
項目 | 値 |
セッション | ga:sessions |
ユーザー | ga:users |
ページビュー数 | ga:pageviews |
ページ/セッション | ga:pageviewsPerSession |
平均セッション時間 | ga:avgSessionDuration |
直帰率 | ga:bounceRate |
新規セッション率 | ga:percentNewSessions |
- 関連記事
-
- SupervisorでPythonのスクリプトをデーモンプロセスとして動かす
- Python 翌日、翌月を取得する(datetime.timedelta,dateutil.relativedelta)
- Google アナリティクスの情報をPythonで取得する(gdata-python)
- PythonでApacheログの解析(apache-log-parser)
- matplotlibで、出力するグラフの画像サイズを指定する
コメント