Hatena::Groupbugrammer

蟲!虫!蟲!

Esehara Profile Site (by Heroku) / Github / bookable.jp (My Service)
過去の記事一覧はこちら

なにかあったら「えせはら あっと Gmail」まで送って頂ければ幸いです。
株式会社マリーチでは、Pythonやdjango、また自然言語処理を使ったお仕事を探しています

 | 

2013-06-24

[]nginx + Webalizerを使って、定量的なログ解析を行なう 02:51

 ここ一週間くらいは、Bookableというサービス改善を行なっていました。

 とはいえ、普通、「サービスを改善する」といった場合、その改良が「改善」というための指標が必要になります。単純に「機能を追加する」というだけでも、一つの「改善」なのかもしれませんが、それが自分のサービスへの「目標」に近づいているのか、という点からも検証される必要があります。

 以前に、このサービスを立ち上げるにあたって、知人から「なんらかのアクセス解析ツールを入れないの?」ということを言われたことがあって、そういえばそういうことに思い至らなかったな、ということで、さっそくアクセス解析ツールらしきものを探したところ、Webalizerというツールを発見しました。

 既にGoogle Analizerなどのサービスはありますが、まだ大規模な分析が必要なほど大きなサービスではないので、とりあえず、簡易なアクセス解析が出来ればいいかな、と思って入れました。

 元々はApacheのログを解析したりするものだったらしいのですが、自分はフロントとしてnginxをたてているため、ログの形式を揃える必要がありそうです。自分は、下の記事を参考にログ形式を揃えました。

nginx + webalizer でアクセス解析 - Folioscope

 一応、ログの形式を揃えることで、ログ解析はできるようになります。ただし、継続的に解析するとなると、設定のところの

Incremental yes

 にしておくと、継続的にログを貯めてくれるのでよいでしょう。これをnoにしておくと、単体のログ解析のみが残るので、ログがローテートしたときに、過去の解析が全部無くなってアウアウしてしまうことになります(というか自分はなりました)。

 で、解析をかますと、下のような静的なHTMLが生成されます。

f:id:nisemono_san:20130625022602p:image

 特に、ポイントになる部分としては、PageとVisitになるのかなと思います。Pageが、あるページにアクセスされた回数であり、Visitは、30分以内に同一のIPで接続していないときは記録するという形になります。

 つまり、ページを閲覧している回数はPageで見て、Visitで、実際に来てくれたユーザーを見ると言うことになります。

 で、このデータについて面白い見方Webalizerの見方|ahref.orgに書いてありました。

平均ページ閲覧数 = 総Pages /総Visits

 自分のページだと、autopagerizeで、自動的に次のページを更新するようにしているので、そのレスポンス数が、そのサイトに興味をもってくれている度合いになるのかな、というので、この指標を参考にしています。

 で、ただデータを取るだけではなく、下のような形で、Google Spread sheetにまとめています。

f:id:nisemono_san:20130625025020p:image

 Spread sheetに、さらに自分が改善した内容を含めて、それがどういう風に影響しているのか、というのを定期的にデータにしています。

 ただ、このデータを見る限りだと、Page/Visit比は、平均10Pageほど見ているので、それなりに閲覧して頂いていることはわかるのですが、問題はやはりVist自体の数が少なくなりつつあることがあり、その辺をどのように増やしていくかが、今後の課題になりそうです。

 |