ot2sy39's note

twitter 140文字じゃ書けないときの外部エントリみたいな

【復習】第16回春だからログ解析するぞシェル芸勉強会:03

続き。

Q3-1 ログの件数が一番多い曜日はどれ

gawk '{print $1}' access_log | xargs date ***** | sort | uniq -c

ってな感じでいけそう、 でもログの行数すごいからうまくxargsで処理できるのか? と思いつつ、man dateでフォーマット文字列を確認してたら、 date -f -なる便利オプションを発見して解決。

gawk '{print $1}' access_log | date -f - "+%w" | sort | uniq -c

Q3-2 ログの件数が一番多い時間帯はどれ

Q1と同じ。自分の中では定番となっていて、あまり他の方法を考え付かない。 結果的には速い方法だったぽいが、考えなしなのは良くない。

gawk '{h[substr($2,1,2)]+=1} END {for(i in h){print h[i], i}}' access_log | sort -rn