查看:1865|回复:0
有关状态码的 awk 命令集合发表时间:2013-01-08 14:34:37

我爱java

0分享0主题0帖子

学徒一级

(初出茅庐)


   200 - 请求已成功,请求所希望的响应头或数据体将随此响应返回。
   206 - 服务器已经成功处理了部分 GET 请求
   301 - 被请求的资源已永久移动到新位置
   302 - 请求的资源现在临时从不同的 URI 响应请求
   400 - 错误的请求。当前请求无法被服务器理解
   401 - 请求未授权,当前请求需要用户验证。
   403 - 禁止访问。服务器已经理解请求,但是拒绝执行它。
   404 - 文件不存在,资源在服务器上未被发现。
   500 - 服务器遇到了一个未曾预料的状况,导致了它无法完成对请求的处理。
   503 - 由于临时的服务器维护或者过载,服务器当前无法处理请求。

有关状态码的 awk 命令示例:

1. 查找并显示所有状态码为 404 的请求

awk '($9 ~ /404/)' access.log

2. 统计所有状态码为 404 的请求

awk '($9 ~ /404/)' access.log | awk '{print $9,$7}' | sort

现在我们假设某个请求 ( 例如 : URI: /path/to/notfound ) 产生了大量的 404 错误,我们可以通过下面的命令找到这个请求是来自于哪一个引用页,和来自于什么浏览器。

awk -F\" '($2 ~ "^GET /path/to/notfound "){print $4,$6}' access.log

追查谁在盗链网站图片

系统管理员有时候会发现其他网站出于某种原因,在他们的网站上使用保存在自己网站上的图片。如果您想知道究竟是谁未经授权使用自己网站上的图片,我们可以使用下面的命令:

awk -F\" '($2 ~ /\.(jpg|gif|png)/ && $4 !~ /^http:\/\/www\.example\.com/)\
{print $4}' access.log \ | sort | uniq -c | sort

注意:使用前,将 www.example.com 修改为自己网站的域名。

   使用 ” 分解每一行;
   请求行中必须包括 “.jpg” 、”.gif” 或 ”.png”;
   引用页不是以您的网站域名字符串开始( 在此例中,即 www.example.com );
   显示出所有引用页,并统计出现的次数。


您需要登录以后才可以回帖    登录|注册