【復習】第16回春だからログ解析するぞシェル芸勉強会:03
続き。
Q3-1 ログの件数が一番多い曜日はどれ
gawk '{print $1}' access_log | xargs date ***** | sort | uniq -c
ってな感じでいけそう、
でもログの行数すごいからうまくxargsで処理できるのか?
と思いつつ、man date
でフォーマット文字列を確認してたら、
date -f -
なる便利オプションを発見して解決。
gawk '{print $1}' access_log | date -f - "+%w" | sort | uniq -c
Q3-2 ログの件数が一番多い時間帯はどれ
Q1と同じ。自分の中では定番となっていて、あまり他の方法を考え付かない。 結果的には速い方法だったぽいが、考えなしなのは良くない。
gawk '{h[substr($2,1,2)]+=1} END {for(i in h){print h[i], i}}' access_log | sort -rn