企业实战考试题:统计一个网站每小时的PV数量

老男孩教育第三关课后实战考试题练习:请统计老男孩老师的博客 http://oldboy.blog.51cto.com/ 博客每小时所有用户访问的pv数量(统计样本5个小时以上)。
要求:老男孩20-21期的学生必答题(务必自己搞出来,能力才会提升),其他期可选。也欢迎linux初学网友们参与解答,高手请绕过。

考试题提示:
1、没思路的,可以VIP群里请群内导师们指导思路,或者自己憋出来。


2、PV(访问量):即Page View, 即页面浏览量或点击量,用户每完整加载一个页面即被计算一个PV


3、curl命令爬网页内容的方法及参数说明
curl --retry 10 --retry-delay 60 --retry-max-time 60 http://oldboy.blog.51cto.com/ -o oldboy_html
注: --retry表示重试次数; --retry-delay表示两次重试之间的时间间隔(秒为单位); --retry-max-time表示在此最大时间内只容许重试一次(一般与--retry-delay相同)


4、wget命令爬网页内容的方法及参数说明
wget -t 10 -w 60 -T 30 http://oldboy.blog.51cto.com/ -O oldboy_html2
注:-t(--tries)表示重试次数; -w表示两次重试之间的时间间隔(秒为单位); -T表示连接超时时间,如果超时则连接不成功,继续尝试下一次连接

 

重点说明:本题主要锻炼学生企业环境实战综合解决问题的能力,涉及知识点有PV知识,定时任务,守护进程,wget、curl、sed、awk、grep等诸多命令的组合应用能力。

大家可以评论给出答案!看谁最快,谁的最简单好用。

 

本文出自 “老男孩linux运维” 博客,请务必保留此出处http://oldboy.blog.51cto.com/2561410/1605983

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。