minofoto and miscellaneous notes

個人的な備忘録ですが、たまに広く読んでもらいたい記事を書くこともあります。記事は随時修正したり追記したりすることがあります。

アクセス解析

頼まれていた計算が、知恵を使ったら予想の 1/10 くらいの時間で簡単に終わってしまったので、余った時間で、簡単なテキスト処理プログラムでアクセスログを解析してみました。

アクセス数 :日記の日付
233 :20130825
174 :20100918
163 :20110703
123 :20120603
121 :不明
105 :20120814

一番人気は、最近書いた 中央アルプス 木曽駒ヶ岳 - 空木岳 縦走 - minofoto and miscellaneous notes でした。Google などの検索エンジンでかなり上位に来るので、検索して見に来る方が多く、短期間でアクセストップとなったようですね。

ありがとうございます。



自分の備忘録用に追記しておくと、はてなカウンターのアクセス URL リストをコピペして

#!/usr/local/bin/gawk-f

{
    url = $1;
    url_date = url;
    gsub(/http:\/\/d\.hatena\.ne\.jp\/Room-B\//, "", url_date);
    gsub(/\/p[1-9]/, "", url_date);
    gsub(/touch\//, "", url_date);
    gsub(/mobile\?guid=on&date=/, "", url_date);
    gsub(/&se/, "", url_date);
    gsub(/mobile\?date=\//, "", url_date);
    gsub(/ction=p[1-9]/, "", url_date);
    gsub(/mobile\?date=/, "", url_date);
    gsub(/\/[0-9]+$/, "", url_date);
    #print url " * " url_date;                                                                                          
    count[url_date] += $2;
}

END{
    for (i in count) {
        printf("%4d :%s\n", count[i], i) | "sort -r" ;
    }
}

というひどく適当なプログラムで日付以外の情報を削除して数を集計しなおしただけです。